ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

海天瑞声在中关村论坛宣布开源多模态数据集 助力数字中国建设

时间:2023-05-31 11:13:12来源:互联网编辑:茹茹

作为中国科技创新领域的重要盛会,以及科技企业实力和形象展示的重要舞台,2023年度的中关村论坛于5月25日晚在北京开幕。中共中央政治局常委、国务院副总理丁薛祥出席开幕式并致辞。中共中央政治局委员、北京市委书记尹力在开幕式上宣读习总书记的贺信。

开幕式上,北京国际科技创新中心建设十项重大科技成果进行了发布和展示。据悉,本届论坛设置了论坛会议、技术交易、展览展示、成果发布、前沿大赛和配套活动六大板块,共举办150余场活动,集中展示了人工智能、区块链、量子信息、高端制造等领域的全球最新进展和前沿科技成果。

今年中关村论坛将开设55场平行论坛,主要围绕人工智能、生命科学等前沿领域,以及数据治理、女性科技创新等热点议题。其中,人工智能开放生态建设论坛于5月26日上午举办。AI训练数据龙头服务商海天瑞声CEO王晓东受邀出席该论坛,并发表了题为《共享开放数据助力数字中国建设》的演讲,宣布海天瑞声将开放多模态数据集。此外,海天瑞声将在A馆1018中关村科技城展台展示公司产品和解决方案。

开源数据集

助力AI开放生态构建


本届中关村论坛的主题是“开放合作·共享未来”。开放生态是全球人工智能发展的大势所趋,尤其是AI算法的优化和模型的训练需要足够优质和丰富的数据集支持,因此共享数据集就成为AI开放生态系统中非常关键的一环,对行业的推动作用也变得至关重要。在此背景下,海天瑞声在本次大会上宣布开放共享数据集就更显得意义重大。

海天瑞声CEO王晓东表示,作为AI数据行业里首家上市公司,海天瑞声天然肩负着开源开放、推进数据资源整合共享的社会责任。开源数据集可以帮助各领域的研究者和开发者快速获得更多高质数据样本,进而提高模型的精准度和鲁棒性,帮助他们更好地进行算法研究和模型训练。此次即将开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度。海天瑞声希冀与全球AI开发者和研究人员建立更加紧密的合作关系,共同推动人工智能技术的发展和应用。同时,开源数据集计划亦是公司对于AI开放生态的一次有益尝试,是公司在数据智能化应用领域持续发力的体现。

去年年底以来,ChatGPT、GPT-4等大模型接二连三地发布,让我们加速走进了大模型时代,并真切地感受到了其与日俱增的能力。众所周知,大模型也需要进行训练,那么在此过程中与数据相关的工作,与此前有什么不同呢?

对此,海天瑞声CTO黄宇凯认为,从大方向上来看并没有什么不同,还是需要先提出数据方案,然后进行设计,再执行采集、标注等一系列的工作流程,最终目标也是让客户能够基于所提供的数据,训练出效果良好的模型。

其中,不一样的地方在于,不同企业关注的侧重点不同。比如,大模型主要分为预训练和强化学习两个阶段,这两个阶段对数据都有很高的要求。就前者而言,虽然大模型对应的是大数据,但却并不是数据越多越好,还要执行数据清洗的步骤。数据公司必须掌握如何清洗、向哪个方向清洗,才能更好地应用于大模型的基础能力。对于后者来说,进行强化学习需要撰写对应的提示词,这对数据标注人员的逻辑思维能力和表达能力也有较高的要求。

对于一家数据公司来说,数据安全与合规是其底线,也是立身之本。因此,海天瑞声组建了专门的团队,对欧盟颁布的《通用数据保护条例》、我国颁布的《数据安全法》和《个人信息法》等法规法规进行了深刻的研究,并制定了高于国家法律的数据合规要求。具体来说,其在整个公司层面上,要求所有成员在严格遵循当地法律法规的基础之上,开展包括数据采集、标注等在内的具体工作。

语音图像再到文本、实现AI数据全覆盖

品牌焕新展现海天瑞声战略新布局


会上,王晓东还隆重发布了海天瑞声企业品牌焕新战略:公司将启用全新Logo,英文名称将从“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞声”不变。

王晓东表示:“此次品牌升级不仅是一个简单的改名,它还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索。”他进一步阐述道,海天瑞声因优质海量的智能语音数据被大家所熟知,但近些年来随着人工智能技术的不断迭代与发展,海天瑞声的业务已从单纯的语音领域服务,扩展至提供覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集,未来还将支持以数据驱动的生成式AI业务发展。显然海天瑞声早已不再局限于“语音Speech”而是更广阔的“数据Data”海洋。为更好地反映公司的业务范围和技术实力,海天瑞声对企业品牌进行了升级,以更好地满足客户全方位需求。

图丨海天瑞声新Logo(来源:资料图)

而品牌升级背后,海天瑞声全新的战略布局也逐渐清晰呈现。据了解,自2005年成立以来,海天瑞声就一直在为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。目前这些数据集已覆盖智能语音、计算机视觉、自然语言等AI核心领域。经过多年深耕,海天瑞声的产品和服务已获得阿里巴巴、腾讯、三星等国内外头部客户的认可,并在自动驾驶、虚拟主播、声纹识别、人脸姿态等众多人工智能场景及相关算法模型的训练过程中获得应用。

随着数据要素作为国家级战略资源地位不断凸显,数据相关企业也肩负起未来数字化基建的重大责任。因此,无论是业务领域的自然扩展还是主动更名的品牌升级,都无疑在证明着一点,即海天瑞声在保障基础数据业务稳健发展的同时已找到新的业绩增长点并不断发力。从近期其在自动驾驶业务的接连动作可以看到海天瑞声正在发力聚焦自动驾驶赛道,通过平台、算法研发以及数据安全能力的持续建设,不断将之打造成为公司核心竞争力之一,使之成为公司第二增长曲线。

深入布局自动驾驶领域

开发全栈式自动驾驶数据平台


基于海量数据构建一套强大的数据链驱动系统,是自动驾驶技术发展过程中的必要环节。而要想推动该系统高效运转就少不了数据采集、管理、标注、质检和仿真等环节的支持和相互配合。

自动驾驶领域是海天瑞声着重进行业务布局和彰显技术实力的核心领域之一。就在上个月18日,海天瑞声正式推出“DOTS-AD自动驾驶平台”。 据海天瑞声CTO黄宇凯介绍,这是一款专为自动驾驶场景设计的全栈式数据平台,能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍。支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化部署。

特别要提到的是该平台的四大核心功能:一是全面支持自动驾驶领域各维度2D/3D/4D点云或图像数据标注;二是能针对不同场景支持辅助标注/自动化标注;三是支持项目的柔性管理,支持流程/工具/标签的自定义;四是可实现对数据的智能化管理,确保客户的商业敏感数据安全合规。基于这些核心功能,海天瑞声正建立起在智能驾驶数据训练领域的核心壁垒,也将赋能自动驾驶技术走迈向新高度。

数据作为人工智能发展的重要一环,大模型的出现为数据需求带来了新的挑战和机遇。海天瑞声王晓东在此次中关村论坛上还表示,公司将坚持以“做智能世界的数据基石”为使命,积极与各方共同推动人工智能技术的发展和应用,促进企业数字化、智能化进程的加速推进,为建设数字经济和智能社会做出贡献。

自2007年中关村论坛初次举办以来,其一直是中国面向全球科技创新交流合作的国家级平台,并始终坚持“科技办会”的重要理念。5月25日,习总书记向今年的中关村论坛致贺信。其指出,当前,新一轮科技革命和产业变革深入发展,人类要破解共同发展难题,比以往任何时候都更需要国际合作和开放共享。中国坚定奉行互利共赢的开放战略,愿同世界各国一道,携手促进科技创新,推动科学技术更好造福各国人民。

据悉,本届论坛将持续到5月30日,期间将有80多个国家和地区的嘉宾出席,近200家外国政府部门、国际组织和机构参与,近120位顶尖专家将发表演讲。借由这样一个平台,海天瑞声及更多优秀的AI产业企业将共同探讨如何更好地依托我国现有开放创新平台建设人工智能开放生态,如何更科学地投入更多研发资源,以提升产品质量和服务水平,共同促进产业发展向前。

更多热门内容
IASP2025年世界大会在京圆满闭幕 签约42项中外合作项目
秋日的北京,创新涌动、合作如潮。经过五天密集而富有成效的大会议程,国际科技园及创新区域协会(IASP)2025年世界大会于9月19日在北京国家会议中心圆满落下帷幕。本次大会以“追求卓越——创新集群助力高质量发展”为主题,成功搭建了全球科技园区开放对话、务实合作的

2025-09-21

内容消费种草Z世代,抖音电商助力英特尔实现“品效合一”
当游戏从单纯的娱乐工具逐步演变为数字陪伴与精神载体,Z 世代用户已将其视作重要的情绪消费场景。搭载英特尔酷睿处理器的高性能游戏设备,以及英特尔酷睿Ultra处理器的AI PC,有效兼顾游戏体验与生产力、AI应用场景的需求,受到Z世代玩家青睐。《2025 游戏行业抖音经营

2025-09-21

丰收节还能这么玩?提前剧透大北农的“节目单”
九月末的北京,秋意初显。在大北农凤凰国际创新园的神农广场上,9月23日就会迎来一场热闹的丰收节。一曲《大丰收礼赞》将以恢弘鼓声正式敲响丰收节的序幕。随后,现场奏唱《国歌》与大北农企业之歌《强农报国》,来自全国各地的农业代表、企业嘉宾与市民观众将共同见证

2025-09-21

X10幻影Plus,全球首发丨EJEAS爱骑仕打破技术壁垒,解锁骑行通讯对讲无限可能
9月20日,在2025中国摩博会的璀璨舞台上,EJEAS爱骑仕以“无线电MESH对讲技术”引领行业革新,正式全球首发最新力作——X10幻影Plus摩托头盔对讲机。这一突破性产品不仅重新定义了专业摩托骑行通讯的技术标准,更以前沿科技与创新设计的精妙融合,瞬间成为全场瞩目的焦

2025-09-21

2025数字音乐产业大会:中国数字音乐产业基地版权服务工作站揭牌
9月19日-21日,2025中国数字音乐产业大会在厦门召开,19日,大会分论坛“数字音乐版权生态建设论坛”正式举行。本次分论坛由中国音数协数字音乐工作委员会、中国音数协数字音乐产业研究专家委员会主办,网易云音乐、国家版权创新发展基地(四川天府新区)联合协办,汇聚了

2025-09-21

更快到手新机 调研显示通过即时零售购iPhone 17中88.39%用户选京东秒送
9月19日8点,iPhone 17系列新品全面开售。与往年新机发售不同的是,今年消费者的购机需求中,“快”成为了核心关键词之一。越来越多渴望尽早体验新机的用户,开始通过即时零售平台下单 iPhone 17 。《iPhone17首销调研》报告更是显示,33.96%的用户希望“越快越好,愿意

2025-09-21

Aqara智能隐形窗帘电机C200发布,首款原生支持Apple Home
9 月 10 日,全球空间智能领导品牌 Aqara 今日正式发布智能隐形窗帘电机 C200。作为首款原生支持 Apple Home 的隐藏智能窗帘,不仅采用全嵌隐藏设计,C200 还可让用户可通过 iPhone、Apple Watch、HomePod 等设备无缝控制窗帘,尽享专属「果粉」的高阶智能生活体验。同

2025-09-20

不同集团赴港上市,高端母婴品牌BeBeBus以洞察破局
近日,高端母婴品牌BeBeBus母公司不同集团于9月15日至18日公开招股,预计9月23日正式上市。基石投资者包括波司登集团关联的信庭基金、百亿级私募机构上海通怡投资及来自新加坡的Great Praise Investment,总认购金额达1500万美元,市场认购反响热烈。从新锐品牌变成国内

2025-09-20

鸿蒙生态加速进击,华为“天工计划”投入10亿元支持AI生态创新
在华为全联接大会2025(HUAWEI CONNECT 2025)上,华为宣布HarmonyOS 5终端设备数量已突破1700万台,鸿蒙生态全速进击发展,AI全场景体验全面升级,并正式启动“天工计划”,未来将投入10亿元人民币资金与资源,全面支持鸿蒙AI生态创新,携手开发者共同迈进鸿蒙AI新阶段。

2025-09-20

中国摩博会九号公司何飞龙:真正的智能电摩,应能“越骑越懂你”
日前,2025中国摩托车重庆论坛隆重举行,来自全国摩托车产业的领军企业、行业专家齐聚山城,共谋行业发展新路径。在备受关注的“新机遇、新模式”圆桌会议环节,九号公司中国经营事业部总裁何飞龙分享了九号公司在产品创新、前沿技术布局与用户体验升级方面的实践,并提

2025-09-20