近年来,随着组织争相为大型神经网络提供大量标记数据,数据标记众包平台变得越来越受欢迎。与传统的机器学习算法不同,深度学习系统,例如于计算机视觉和文本处理工作负载的系统,需要大量的数据。当缺乏真实世界的数据时,一些组织求助于使用合成数据,但这并不是在所有情况下都适用。
托洛卡数据(Toloka)是当今主要的众包平台之一,每月有20万活跃的执行者,他们来自100个国家,讲40多种语言。每天,超过600个项目在这个平台上运行,超过15,000,000个任务由世界各地的数据标注员(Tolokers)完成。托洛卡数据(Toloka)使命是为所有AI数据生产提供一个工业环境。
在计算机视觉部门,托洛卡数据(Toloka)提供图像分类、并排比较、边界框、多边形、关键点和图像转录标签服务。在自然语言处理(NLP)领域,公司提供文本识别和分类、情感分析、命名实体识别和搜索相关性服务。它还收集音频并提供音频数据的过渡和分类。
托洛卡数据(Toloka)是2000个成功的数据采购、数据注释和模型评估项目的可信赖的合作伙伴,使最具创新性的公司能够执行、扩大和改进世界级的人工智能计划。其中包括Yandex、Aliexpress、Handl、FAANG等案例。
该平台的人员结构分为请求者(寻求数据标签的人)和执行者(也称为Tolokers)(进行实际标签的人)。得益于在该领域的丰富经验。 托洛卡数据(Toloka)评论数据生产的演变方面占有优势,每一个解决方案都在质量、灵活性和可扩展性方面被定义。
该公司的开放API使客户能够建立可扩展和完全自动化的人机回环机器学习管道。托洛卡数据(Toloka)采用了任务和执行者的智能匹配以及基于人工智能的性能质量预测,以确保结果正确无误。该平台由强大的数据安全协议管理,托洛卡数据(Toloka)正在获得国际标准化组织(ISO)的数据管理认证。
今年,为了满足客户需求,公司开始在亚洲和中国市场发展,帮助中国企业走向世界。托洛卡数据(Toloka)计划在中国发展其服务和能力,创造新产品,并与中国合作发展基础设施。
"托洛卡数据(Toloka)的使命是通过普及提供数据所有权来推动人工智能的发展。全球人工智能行业正在迅速发展,但我们的市场研究表明,缺乏原始的、有标签的数据是数据科学家和企业家的主要障碍”,Toloka首席执行官奥尔加·梅戈尔斯卡娅解释说:“通过众包,托洛卡数据(Toloka)为数据科学家和人工智能企业提供了一个强大而实惠的工具,来生成新的令人兴奋的数据,随后用于训练各种人工智能算法。”
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com