加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

数据是人工智能的基础

发布时间:2021-04-07 12:08:58 所属栏目:动态 来源:互联网
导读:chanical Turk 之类的服务来验证整个项目过程,生成 100,000 个合格样本数据集的话,花费大约为 70,000 美元。 如果已经收集了大量数据,则可以使用专业的数据标注服务公司来对其进行标注。在这种情况下,获得 100,000 个带有标签的数据样本,则可能需要花费

chanical Turk 之类的服务来验证整个项目过程,生成 100,000 个合格样本数据集的话,花费大约为 70,000 美元。

如果已经收集了大量数据,则可以使用专业的数据标注服务公司来对其进行标注。在这种情况下,获得 100,000 个带有标签的数据样本,则可能需要花费 8,000 到 80,000 美元的费用,具体的需要取决于标注的复杂程度。

此外,检查和校正数据样本与生成和标注数据样本一样耗时。Dimensional Research 研究报告中提到,66%的公司在其数据集中遇到偏差和错误问题。有些公司选择采用完整的内部方法(自己做所有标注),也有一些公司会选择外包和内部混合使用。第二种常见的情况是将大部分工作外包,然后由公司个别人员负责验证和清理。外包 10 万个数据样本的初始成本可能会增加大约 2500 至 5,000 美元。

除了数据成本外,还有算法人工成本、算力设备成本、项目落地成本。除去附加项成本和一系列功耗所带来的成本,机器学习项目可能会使公司花费 51,750 美元至 136,750 美元(不包括难以确定的其他成本)。价格差异主要是由数据的决定的。这是一个非常乐观的估计。如果企业位于美国,并且使用的是优质的数据(自由职业者不会这样做),则与人才相关的费用将激增,使人工智能机器学习项目的费用超过 108,500 美元。

这样高昂的价格使想要解决新问题或让其流程自动化。决策的个人、小型团队和初创企业无法使承担。

数据处理中最难的是什么?

最艰难的步骤是第一步:获取数据。没有数据,几乎不可能在研究阶段验证机器学习解决方案,从而导致项目进度几乎无法进行。

随着工业、医疗、安防、教育、金融等领域意识到未来人工智能对于行业改变的重要性,都纷纷入局开发自己的人工智能应用,但是随着这些领域

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!