数据交易

From GoToken's Wiki!
Jump to navigation Jump to search

隐私[edit]

  1. 定义:对于隐私这个词,科学研究上普遍接受的定义是“单个用户的某一些属性”,只要符合这一定义都可以被看做是隐私。定义中着重强调的是“单个”用户。所以一群用户的某一些属性,可以认为不是隐私。

中国法律的定义: GDPR的定义:

从隐私保护的角度来说,隐私是针对单个用户的概念,公开群体用户的信息不算是隐私泄漏,但是如果能从数据中能准确推测出个体的信息,那么就算是隐私泄漏。

数据公开的场景[edit]

  1. 公司为了学术研究和数据交流开放用户数据,学术机构或者个人可以向数据库发起查询请求,公司返回对应的数据时需要保证用户的隐私。
  2. 公司作为服务提供商,为了提高服务质量,主动收集用户的数据,这些在客户端上收集的数据也需要保证隐私性。

数据市场的现状[edit]

近年来,大数据已从概念落到实地,在精准营销、金融、智慧医疗、影视娱乐、教育、体育、安防等领域均有大量应用,随着云计算、物联网、移动互联网等支撑行业的快速发展,目前我们可以用极低的成本存储和计算数据,在此基础上未来大数据将拥有更为广阔的应用市场空间。

大数据产业构建可分为6个层次,分别为:硬件设施、基础服务、数据来源、技术开发、融合应用及产业支撑。而目前大数据软件子市场包括数据管理和集成平台、商业智能与分析工具、分析与性能管理应用三部分。

隐私保护的方案[edit]

学术界提出了多种保护隐私的方法和测量隐私是否泄露的工具

  1. k-anonymity(k-匿名化)
  2. l-diversity(l-多样化)
  3. t-closeness
  4. ε-differentialprivacy(差分隐私)
  5. 同态加密(homomorphic encryption)
  6. 零知识证明(zero-knowledge proof)

数据交易市场的规模[edit]

基于数据产生的经济收益[edit]

互联网公司的广告收入规模[edit]

  1. 腾讯:二零一八年,我們的網絡廣告業務錄得人民幣581億元的收入,同比增長44%;第四季的收入為人民幣170億元,同比增長38%。在微信朋友圈、小程序、QQ看點及移動廣告聯盟的推動下,社交及其他廣告收入全年同比增長55%至人民幣398億元,第四季則同比增長44%至人民幣118億元。在推出第二個每日廣告位後,我們收到廣告主積極反饋,而整體廣告填充率仍高,約50%的朋友圈日常活躍用戶會看到第二個廣告位,朋友圈廣告點擊率保持在健康水平。媒體廣告收入全年增長23%至人民幣183億元,第四季增長26%至人民幣52億元。其中,二零一八年視頻廣告收入同比增長34%,第四季同比增長21%,這是由於我們自製的綜藝節目大受歡迎,以致視頻播放量及廣告贊助增加所致。我們的新聞廣告業務在系統升級後恢復增長,收入在下半年重拾同比增長。媒體信息流廣告收入同比增長逾10倍

金融风控[edit]

医药保险[edit]

房地产[edit]

其他[edit]

数据市场存在的问题[edit]

当前普遍使用的隐私保护方案[edit]

数据的来源[edit]

需要”可信“交互才能进行的数据交易市场的规模[edit]

多方数据交易的场景[edit]

行业规模[edit]

根据几个公开信息源给出的数据,当前全球大数据市场的规模约在数百亿美元左右,预计在2025年将增长到千亿美元规模。(来源:Forbes , Forrester)

在中国,2018年中国大数据产业规模为4,384.5亿元,同比增长23.5%;到2021年,中国大数据产业规模将超过8,000亿元。 (来源:赛迪研究院)根据市场分析和调查,2017年全球有53%的公司采用大数据分析,2019年,该比例上升至64%。其中物联网(IoT)、机器人自动化、AI解决方案、基础设施及服务(IaaS)及视频监控等市场的增长将成为推动大数据市场增长的主要因素。

根据国际数据公司(IDC)的监测数据显示,2013年全球大数据储量为4.3ZB(相当于47.24亿个1TB容量的移动硬盘),2018年全球大数据储量达到33.0ZB,同比增长52.8%。而希捷科技的一项最新研究表明,到2025年全球数据量将会从2018年的33.0ZB上升至175ZB。与此同时,中国数据圈增速最为迅速,平均每年的增长速度比全球快 3%。2018年,中国数据圈占全球数据圈的 23.4%,即 7.6ZB。预计到 2025 年将增至 48.6ZB,占全球数据圈的 27.8%,中国将成为全球最大的数据圈。(数据来源:IDC)

平台属性[edit]

大数据交易平台的主体主要分为两类:一类是以企业为主导的大数据交易平台,这些交易平台多为企业独资或合资运营,以阿里云、京东万象、浪潮天元数据、数据堂为代表,约占82%;另一类是由政府主导的大数据交易中心,这些中心多为政府/国企独资,或国企与民企合资,如贵阳大数据交易所和上海数据交易中心等,约占15%,其中60%左右为政府控股。

国内目前大数据交易业务涉及的行业主要为金融征信、交通地理、移动通讯、企业管理及医疗数据等,这与国内大数据企业主要业务方向基本一致,其中金融征信及企业管理数据交易近两年增长迅速。

盈利模式为提供平台服务、撮合交易收取佣金、销售自有数据、提供增值服务等。虽然大数据交易市场的规模逐渐增大,但大部分平台仍处于推广阶段,收取平台费用及交易佣金的平台相对较少,整体交易行业营收偏低

平台的交易方式[edit]

  1. 只提供交易渠道,满足大数据交易的最低要求 (将数据脱敏),如上海数据交易中心,只连接买方和卖方,不存储也不传输隐私数据
  2. 除了提供交易功能之外,还有进一步挖掘大数据价值的功能,如贵阳大数据交易所,它不交易原始数据,交易的是经过清洗,脱敏,分析等流程后形成的大数据产品
  3. 不提供大数据价值功能,而是通过爬虫或者向大数据来源方购买来获得大数据产品,再进行售卖。如数据堂,这种形式更类似于大数据的卖方身份

业态类型[edit]

  1. API接口平台
  2. 淘宝式平台
  3. 结合云服务的平台
  4. 数据采集、分析、售卖一条龙服务的平台

数据的来源[edit]

  1. 大数据的来源方:数据的“矿主”,占市场卖方多数,多数的数据交易平台都拥有数据的来源方 (当前市场还是卖方市场)
  2. 大数据来源代理方:受大数据来源方委托,为其开发,开放数据,代替其在数据市场交易数据 (如twitter和它的代理商的关系),重庆、贵阳、华中交易所都支持数据代理方交易

交易的标的[edit]

  1. 预处理的大数据产品:解决数据的无序性(数据清理,梳理,打标签)和数据的敏感性(数据脱敏:可恢复类脱敏和不可恢复类脱敏)
  2. 大数据分析产品:已经对预处理的大数据进行了分析、建立了数学模型,进行可视化等深加工之后的大数据产品

交易的流程[edit]

  1. 卖方主导:会员申请 -> 资格审核 -> 成为会员 -> 发布产品 -> 安全审核 -> 产品上线 -> 交易请求 -> 交易撮合 -> 交易清算 -> 数据配送 -> 产品反馈
  2. 买方主导(多了一个发布需求的流程):会员申请 -> 资格审核 -> 成为会员 -> 发布需求 -> 发布产品 -> 安全审核 -> 产品上线 -> 交易请求 -> 交易撮合 -> 交易清算 -> 数据配送 -> 产品反馈

数据交付方式[edit]

  1. 数据包
  2. API
  3. 分析结果

交易模式[edit]

  1. 个人大数据:未经允许售卖个人数据违法,但是没有对自己售卖自己的数据有任何规定
  2. 商业大数据:有不同的分类方式,典型的分类包括:
    • 医疗大数据:病例、就诊、医药
    • 金融大数据:企业、个体、个体户
    • 企业大数据:中小微企业、外资企业
    • 电商大数据:商品交易、药品流通
    • 能源大数据:石油、天然气等
    • 交通大数据:停车场、车辆位置
    • 商品大数据:电子标签、商品物流
    • 消费大数据:个人消费、个人征信
    • 教育大数据:学习轨迹、交易消费
    • 社交大数据:与社交相关的所有数据
    • 社会大数据:与社会管理、政府管理相关的数据
  3. 政府大数据

问题[edit]

  1. 数据的质量参差不齐
  2. 数据的“价值”评价机制缺乏
  3. 隐私保护

数据切入场景[edit]

  1. 自有数据
    1. 互联网企业的自有数据:京东万象,阿里云API...
    2. 企业数据中台中的自有数据
  2. 采集数据

数据的应用[edit]

  1. 客户的画像:B端企业
  2. 用来干嘛:
    1. 内部运营和管理:明细数据和宏观数据
    2. 商业应用:
      • 趋利
      • 避害

数据中台系统[edit]

  1. 神策, 融资情况
  2. 数澜, 融资情况
  3. 诸葛IO融资情况
  4. Growingio,融资情况
  5. 友盟融资情况

数据市场[edit]

Reference[edit]

  1. https://zhuanlan.zhihu.com/p/32579749
  2. https://zhuanlan.zhihu.com/p/105604980
  3. 国内外大数据交易平台调研分析
  4. https://blog.naaln.com/2019/12/report-data-transaction/
  5. http://www.cbdio.com/BigData/2016-06/02/content_4965656_all.htm
  6. http://www.cac.gov.cn/wxb_pdf/baipishu/dashuju020180418587931723585.pdf
  7. https://zhuanlan.zhihu.com/p/32579749
  8. https://mp.weixin.qq.com/s?src=11&timestamp=1584267616&ver=2218&signature=gGwwgeKGvyTUh2XTqFhfKcQXKJYByNwZ7b3TI3Fv4VFeKj88i*Hxu4uPehyxHrxxOhWiC-RYchYUrWiyv1JjQ2LvhL9RZaVoA575gZiBga71dkAu6osj7VCt8HhVLQCx&new=1
  9. http://www.gbdex.com/website/resources/download/2016.pdf
  10. https://mp.weixin.qq.com/s/VSbkAzho0-2J0pIiKMkOIg
  11. https://m.huxiu.com/article/254275.html?f=pc_new_share_article_wechat
  12. https://www.adquan.com/post-2-228687.html