爱数智慧荣获CIO Outlook 2019“TOP10大数据解决方案服务商”
2019年12月,面向亚太地区的企业技术杂志《APAC CIO Outlook》评选的“Top 10 大数据解决方案服务商-2019”榜单正式出炉。北京爱数智慧科技有限公司成功入选该榜单,并进入杂志2019年度大数据技术特辑。
APAC CIO Outlook 是一份面向 CIO、CTO 以及其他IT高层及领导的杂志,专注于向 CXO 群体分享企业 IT 的经验、智慧与建议。“Top 10 大数据解决方案服务商-2019”是亚太地区重要的年度IT专业领域榜单,在亚太地区IT专业人群中具有广泛影响力。
爱数智慧APAC CIO Outlook“Top 10 大数据解决方案服务商-2019”证书
人工智能被认为是第四次工业革命的重要推动力,是结合计算、硬件和数据的一个重要结合点。人工智能技术与产业的结合不断深化,企业逐渐感受到智能化带来的好处。比如,通过人机协同的方式,企业将员工从简单繁重的任务中解放出来,让他们有更多的时间来处理更复杂的问题或提供更好的客户服务。
目前,人工智能模型仍然需要通过大量的训练数据来学习如何有效地执行任务。因此数据被誉为人工智能产业发展的“原油”,是影响模型实用性的重要因素。但是自然产生的数据具有多源异构的特点,可用性较差。“花在数据采集和处理上的时间多,花在训练模型上的时间少”成为AI从业者的共识。随着应用场景多元化和智能化应用的拓展,数据从非结构化到结构化的精加工需求亟待满足。
此次入选APAC CIO Outlook “Top 10 大数据解决方案服务商”的爱数智慧是专业的AI数据服务商,为客户提供一站式数据解决方案,包括制定方案/计划、数据采集、数据标注/处理等全链服务。
爱数智慧在北京总部搭建了符合NC-20声学标准的录音间,并且可实现混响可调的功能。该录音间配备了行业标准录音设备,用于采集对声学环境有严苛要求的数据。为了提高数据采集效率,爱数智慧通过众包App,将录音间从“线下”搬到了“线上”。这一方面减少了地域限制,可以便捷地触达更多的发音人;另一方面,由于发音人的地域覆盖更广,发音习惯、口音等各不相同,使得收集的数据特征更加广泛。这些特征广泛的数据,可以有效地降低模型的偏差。
采集的数据需要经过标注,才能转化为机器可识别的语言。而数据标注被认为是一项复杂且耗时的工作。为了降低“人”在数据处理中的介入程度,爱数智慧自主研发了人机协同的数据处理平台。该平台将人的智慧和机器良好的记忆力结合起来处理数据,利用人工智能技术对数据采集、标注、验收等过程进行监督,为数据结构化过程赋能。
爱数智慧的工作人员表示“在模型训练中,由于数据量较大,因此数据的一致性非常重要。”清晰的标注规范可有效提高数据的一致性。在数据标注的实操环节,爱数智慧标注团队制定了一套符合实际应用的标注规范。这些标注规范有助于提高标注速度,保证数据的一致性,并且降低了标注的错误率。
爱数智慧数据服务类型
据了解,爱数智慧拥有50多种语言的采标能力,不仅包含常用语种如中文、英语、日语、韩语等,也覆盖了一些小语种如他加禄语、印地语等。爱数智慧可直接交付的成品数据集时长超10万小时。这些数据集可用于快速提升模型性能,并帮助模型迅速部署到不同的语言区。该公司在多语种自然式对话数据制作上拥有行业认可的专业度。日前,其制作的中文自然式对话数据集成功入选LDC Catalog,引起了行业的广泛关注。
人工智能产业化已成为时代浪潮,产业链正在逐渐完善。爱数智慧创始人兼CEO张晴晴在接受采访时表示“作为产业链的基础层,我们将持续提供高质量的数据,助推人工智能产业化”。