不能既要又要,这是不行的,好多牛逼科学家并没有多高尚的品德。
爱因斯坦、牛顿都是这样,道德坏到了极点。
所以人工是一笔很大的开支,毕竟养个顶尖团队并不便宜,另外就是数据,高质量数据等于黄金。
这个数据不是在互联网抓取来就行的,而是那些没污染,很原始有价值的数据。
互联网好多数据都是被污染过的,比如造谣,比如刘天仙的那些假新闻,都是经过二次加工的,并不是真实的。
而这些数据要进行清洗才行,百度AI那么笨,就是他有很多污染的数据,看不到真实的。
另外很多数据要去买才行,比如医疗患者隐私数据授权,单数据就要100万美刀,这是没受污染的数据。
比如金融实时交易数据接口费,年费就达千万美刀。
还有很多文献,医疗影像、新闻文章、知识图谱、学术论文太多数据了。
另外街景图片,行为日志,对话语料数不胜数的数据,想要拿到最原始的数据,就要花钱,这并不是一笔小数目。
内容未完,下一页继续阅读