家里有矿 | 蝶链科技创始人彭勇:IPFS将成为多维度数据的底层基础

近期,Filecoin和其底层协议IPFS成为行业内热议的话题。作为分布式存储的区块链网络,Filecoin为区块链行业带来了新的发展模式。2020年下半年,Filecoin主网有望迎来上线。为此,金色财经联手IPFS100.com推出IPFS领域系列AMA访谈栏目「家里有矿」,首期从入门到精通,为读者全方位解析IPFS。

7月22日19:00,「家里有矿」首期第一场AMA正式举行,蝶链科技创始人彭勇作为首场嘉宾,做了主题为“大数据时代下 IPFS的机遇在哪里”的演讲。金色财经合伙人&IPFS100.com CEO佟扬、金色财经内容总监王瑜琨、ChainUP海外市场总监&张姨杨姨视频联合创始人张姨担任此次直播的观察员。

FajW0cpHyTLJO203L31LOEb1BQymtt6aGzVwUoYt.jpeg

以下为直播详情:

王瑜琨:欢迎来到金色财经&IPFS100联手推出的「家里有矿」,请「家里有矿」观察团的团长佟掌柜来为大家做个介绍!

佟扬:从五月份开始,IPFS的热度已经到了一个非常巅峰的状态,在金色布局了半年以后,我们的IPFS100.com平台已于近期上线,因为是金色集团旗下的另外一个生态平台,所以IPFS100.com跟金色有着千丝万缕的联系。

大家从本期的活动也可以看出,「家里有矿」是金色财经和IPFS100.com共同打造的栏目。我们非常重视IPFS整个生态的发展,尤其是希望能够在之前有一些乱象的这个前提下,帮大家梳理出来一套可以致富的逻辑。

下面就有请出我们这次的非常优秀的嘉宾,蝶链科技的彭总。

彭勇:我是来自蝶链科技的彭勇,2018年我和我的合伙人创建了蝶链科技,我本人原来一直都在互联网创业,2018年切入到区块链创业。

王瑜琨:今晚观察团出场的是张姨,有请张姨做个简单自我介绍。

张姨:我是张姨,目前主业是ChainUP海外市场总监,负责全球英语区国家线上品牌推广,线下市场活动,商务合作等,当然现在疫情影响,主要负责国内市场和大客户这边,ChainUP是全球领先的区块链技术服务商,主要提供交易所技术支持,流动性支持,开交易所就找ChainUP。我们的新官网上线了,欢迎大家带朋友来体验,体验一把开交易所的乐趣。同时,我自己在做区块链视频栏目「张姨杨姨」,以吐槽的方式为大家分享区块链干货,目前已经上线了4个多月。

王瑜琨:期待张姨的活跃,话题正转,有请彭总正式开始今天的分享。

彭勇:今天跟大家聊聊在大数据时代下IPFS的机遇。因为我是学计算机技术出身,当我选择IPFS这个分布式存储的行业,是因为我认为数据是未来最大的价值体,存储、传输、计算是数据为人类服务的三大核心。数字经济时候的大数据有一些特点:

1.数据量巨大,存储成本高。在2006年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;在2011年,这个数字达到了1.8ZB。到2020年,整个世界的数据总量预计将会增长44倍,达到35.2ZB(1ZB=10亿TB)!我们可以想象一下,现在的一部手机的存储都会比以前计算机的存储都要大得多。

随着5G技术的普及,物联网技术的成熟,各种摄像头、传感器、智能硬件的爆发性应用,会导致海量数据存储的需求。例如,我们现在可以想象,全国各地,只要是公共场合都会有摄像头的存在,摄像头的质量越来越高级越来越来高清,需要的存储空间也会越来越大。各种传感器以前应用的并不多,不过随着5G网络的推出,传输通道问题已经解决,边缘云与边缘计算的发展会解决了数据处理的问题,各个行业深度的数据应用就越来越多,各种各样的传感器就会应用越来越广泛,它们是未来智能世界的数据基础,智能硬件也越来越流行,无论是家庭类的各种智能硬件,还是个人穿戴类的智能硬件都会有广泛使用,海量的数据都会产生。我们可以想象一下,仅仅当前我们自己拍摄的照片和视频占用空间就让我们不堪重负了,十年后产生的数据量更是不可想象。

2.数据场景复杂,应用面广。数据存储只是大数据的应用之一,根据不同的场景对数据的需求也不同。例如视频分发场景,绝大多数的内容需求场景都是非常分散的,一部热播的电视剧的用户是分散到全国的各个地方,也就说全国的客户端到到视频服务器上来取数据。这样的模式是比较低效的,比如:《战狼》的视频播放量是超过10亿次,如果这个视频文件大小是1GB的话,整个视频就要消耗1000PB的带宽的量。对服务器的带宽压力就可想而知,当然带宽的成本也是非常高的。在这种情况下,就需要有一种更加高效的数据存储和分发方式。或者换句话来讲,在视频分发的场景下,数据高效分发的需求要大于单纯的数据存储需求。

3.数据维度多样性,价值大。一提到“大数据”,很多人的第一反应都是数据量特别大,其实“大数据”的本质含义是数据维度多。这是什么意思呢?只有数据维度多才有数据分析的意义。到了数据社会,数据就成为了最宝贵的财富。这也是为什么一些世界级的公司都愿意把人工智能的算法能力提供出来,因为算法已经不是竞争的关键点,真正竞争关键点已经转变成为了数据。例如谷歌公司,把自己的人工智能算法能力公开,所有使用其算法能力的公司都相当于源源不断为谷歌公司算法在喂养数据,那么谷歌的人工智能成长速度就会很快。

4.数据成为生产要素,是经济变革。2020年3月30日中央发布的第一份关于要素市场化配置的文件,明确地表示数据成为生产要素。这可谓一个标志性事件,表明数据将会是未来社会数字化、信息化发展的重要基础。所谓生产要素,是说这一经济资源,对于全要素生产力的充分发挥,对经济社会的全面持续发展,对经济组织与参与个体非常重要,不可或缺。那数据要成为生产要素,确权,保护,定价、交易等一系列的问题就需要有新的技术来做保障。我个人认为未来人工智能、区块链和大数据这三项新兴技术,分别代表着生产力、生产关系和生产资料的变革。

技术变革是经济变革的一种基础支撑,为什么IPFS会在大数据时代有机遇,首先我们了解一下目前互联网的基础协议HTTP,我们可以先看一下HTTP到底是做什么的。

HTTP被称为超文本传输协议,规定了客户端和服务器之间文件规范,也是我们很多网站的标准协议,本质上也是规定了文件存储的方式。因为互联网的各种网站都基本使用HTTP的协议技术,所以说HTTP是现代互联网的基础一点都不为过。不过,随着互联网的不断发展,这种中心化的服务器的弊端也就是越来越显现出来,因为有一个中心化的服务器,那么这个中心化的服务器就成为了整个网络的最为要害的关键点和瓶颈点。当服务器出现问题,当服务器响应能力达不到的时候,当连接服务器的带宽出现问题,甚至只是给服务器提供服务的第三方出现问题都可能导致服务器无法访问。

在这里我们举两个案例:一个是2015年5月27日下午,支付宝全国大规模断网事件。由于杭州市萧山区某地光纤被挖断导致。第二个是2016年10月21日半个美国网络瘫痪事件,提供动态DNS服务的Dyn DNS遭到了大规模DDoS攻击,攻击主要影响其位于美国东区的服务,包括GitHub、Twitter、Airbnb、Reddit、Freshbooks、Heroku、SoundCloud,、Spotify 和 Shopify。

那什么是IPFS协议呢?IPFS又有什么特点?

IPFS被认为是HTTP的竞争型的协议,IPFS是interplanetary file system的缩写,翻译成中文是星际文件系统。A peer-to-peer hypermedia protocol, to make the web faster, safer, and more open.这是IPFS官网上对它的一个描述,简单来讲是:一个p2p的超媒体协议,让互联网更加快速、更加安全和更加开放。总结起来就是,这是一个协议,它更加快速、更加安全和更加开放。既然提到更加,那么它和谁相比才能成为更加快速、更加安全和更加开放呢?

接下来我们讲讲IPFS协议出现的背景:

IPFS是由墨西哥裔美国人、斯坦福大学毕业的Juan Benet发起的一个协议,这个协议曾经在YCombinator(目前美国最大的孵化器公司)孵化竞赛中拿到了巨额的投资,他们之后成立协议实验室,并在2017年的8月为IPFS上的激励层Filecoin进行募资,有着全世界最知名的一些投资机构投资了这个项目,例如红杉资本、知名硅谷风投Union Square Ventures,还有 Winklevoss Capital、 Digital Currency Groupm、最后Filecoin募资超过了2亿美元。

大数据时代下IPFS的一些应用

我们谈到了大数据的时代的几个特色,传统的技术对新时代的需求越来越难以满足,而IPFS作为一代新的技术孕育而生,对解决这些需求提供了一套关键性的解决方案。

IPFS应用于数据存储。未来时代是一个海量数据的时代,数据爆发的速度会超乎我们想象。这些数据如果都采用原来的数据中心方式存储,会快速推高整体的数据存储成本。并且由于传统的存储方式采用目录存储,和文件的内容毫无关系,这样就导致极大浪费存储空间,提高存储压力。例如,一部热门的电影可以会存在于很多的视频网站之中,也会存储于很多的个人电脑之上,同样一份内容被存储了成千上万份,就更加让本来昂贵的存储更加捉襟见肘。

IPFS提供了一套分散化存储的方案。不需采用集中式存储的方式,而利用一些个人节点空闲存储空间,通过租用他们的空闲存储空间来实现数据存储的目的。由于个人的存储属于闲置空闲空间,所以对于出租空间的利益需求远不如中心化存储,也因为提供存储会比较多,所以整体会极大降低存储的成本。

另外,由于IPFS采用内容寻址的方式,即通过文件内容的哈希值来寻找文件。由于哈希值具备唯一性,这样全网的文件就会只有一个,不会再出现一个视频文件成千上万份这样的现象。IPFS下只需要按照策略,全网保存几个备份即可,所以存储的效率也会比原来高的多。

IPFS应用与不同的大数据场景。视频分发场景是其中的一个重要场景。当全网的视频数据越来越多,视频的分发就会成为一个大的问题。随着观看视频的用户越来越多,承载视频的服务器的压力就会越来越大,互联网的带宽也会越来越大。举个例子,如果我们利用一台无人机实时拍摄一场比赛的实况,这个时候想要同时看视频的人坑就会有成千上万,这个视频拍摄点可能根本没有那么多的带宽资源来接入这么的用户。在这种情况下,如果假设在IPFS网络上,已经观看视频的IPFS用户自动贡献出一点存储空间来存储视频内容,有一部分人可能就不用直接去最前端的来提取视频数据,而只需要在已经存储视频数据的其他用户那里提取就可以了。虽然他们观看的视频可能比真正的实况慢那么十几秒几十秒,不过,这也在人们的可接受范围之内。这样一来,最前端的数据的分类压力就会缓解很多。

IPFS成为多维度数据的底层基础。多维度数据分析是大数据应用的重要基础,各个维度的数据越全面才能越能支持数据的分析和挖掘。IPFS网络作为底层,再配合其他的应用就可以更好的实现数据的多维度分析。例如,个人健康的多维度分析,就需要以这个人的基本信息作为核心来不断收集各种各样的信息来进行统一分析,需要考虑到所有信息的分级管理,哪些信息是完全隐私任何人都不能查看,哪些数据是可以通过用户授权给相关的医疗机构来查看,哪些数据是可以公开查阅。这些都是可以通过IPFS在加上某些应用就可以实现。

最后总结一下,大数据是未来世界的基础,如何保障这个基础的安全、稳定、高效,这就需要IPFS贡献出自己的力量。而且大数据会有各种各样的应用,随着IPFS技术不断成熟,生态不断强大,在大数据的时代下,IPFS会有非常大的机遇。乘风破浪会有时,而此时风光正好。相信很多人都和我一样,在这个天时地利的环境,预期IPFS将会蓬勃发展,一往直前。非常感谢金色财经和IPFS100提供平台跟大家分享!

张姨:我想问一个关于用户隐私安全的问题,Filecoin网络志在建立一个通用的平台,打造一个信息自由交流的平台。在一个自由流通的数据平台内,隐私的保护更加重要。在中心化的存储方式下,用户往往无奈选择信任平台,平台借助自己的技术实力来提供安全和隐私保护,但是,我们仍然经常听到隐私泄漏的各种事件。但是在类似Filecoin这样的网络中,由于存储更加分散,存储服务的提供者(矿工)安全保护的实力参差不齐,用户数据安全和隐私如何进行保障呢?

彭勇:我们想保护隐私就得先了解隐私泄露的几个途径:

在大数据中隐私泄露大概有两个方面,第一个来自于外部黑客的攻击,第二个来自于内部管理员的泄密。

第一个攻击的手段中有非常多的技术可以用,但是核心是能定位找到数据服务器。传统的数据机房,它的数据是在一个服务器里面完整保存,所以当黑客攻击进入到服务器后,数据很容易被泄露。IPFS把数据分成非常多的256kb的数据块,存在不同的服务器中,同一台服务器很难获取完整的数据,所以当黑客攻击到一台服务器的时候,就非常难获得完整的数据。他需要攻克所有文件存储的服务器,这个难度是非常的大

第二个来自于管理员的泄露数据。IPFS存储文件可以用加密的方式存储,并且在一台服务器上没有完整的数据,所以一台服务器的管理员是非常难泄露存储在他服务器上的隐私数据。

张姨:对于传统矿工来讲,Filecoin意味着哪些思维方式的改变,向 Filecoin「转型」难度有多大?因为有看到很多传统做的很好的矿场 但是在Filecoin可能会被认为是新手,这个尴尬的处境是因为转型比较困难么?

彭勇:其实Filecoin还没有正式上线,但是测试已经快一年半的时间了。对传统的矿工来说,经济模型发生了转变,技术也发生了转变,运维的难度也大。

首先经济模型上,除了有爆块收益以外,还会有存储收益和检索收益。但是Filecoin有质押机制和惩罚机制,这个跟原来有很大的不同,这个不只是为了保护链的安全,还要保护数据的安全。

另外,技术运维上会比传统的挖矿要高不止一个难度系数,Filecoin挖矿不光要考虑电耗,还有网络传输,IO瓶颈等等,稳定是未来挖矿的首要任务。Filecoin挖矿也不会像过去传统挖矿一样的开关机,仅仅只要考虑电的费用,还需要考虑非常非常多的因素。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。