在近期世界人工智能大会余温尚存之际,上海再次吸引了科技界的目光,迎来了2025 CCF中国开源大会。此次大会于8月2日至3日召开,汇聚了众多业界精英与专家学者。
宇树科技创始人王兴兴在会上发表见解,指出具身智能要在未知环境中有效服务人类,关键在于实时生成多样化的动作。他认为,尽管当前机器人硬件已较为成熟,但具身智能大模型仍存在显著缺口,期待一个能推动机器人领域发展的“ChatGPT时刻”。同时,他也提到,获取精确数据成为制约具身智能机器人升级的难题之一。
会议期间,开源成为多位与会者共同关注的焦点。开源,即公开代码供所有人查看、使用、修改与分享,其共享、协作、透明的精神正深刻影响着多个领域,包括软件、教育、科研以及硬件等。中国工程院院士、清华大学计算机系教授郑纬民指出,AI大模型的生命周期中,数据获取、预处理与模型训练环节成本高昂,开源模式有助于小企业跳过这些环节,专注于模型微调和推理。
中国科学院院士、南京大学教授吕建强调,开源能够汇聚全球开发者的力量,共同改进模型,推动AI技术的不断进步。开源不仅降低了技术门槛,还催生了更多创新想法和服务,成为推动全球科技创新和共同发展的重要路径。
然而,开源在AI领域也面临挑战。中国科学院院士、北京大学教授鄂维南指出,AI正在经历范式转变,数据成为核心。但数据作为企业核心资产,其价值日益凸显,同时公众对数据保护的意识增强,导致大量数据因安全考虑无法公开。这一现实困境限制了AI开源的深入发展。
中国科学院院士、北京大学教授梅宏进一步解释,即便大模型参数公开,若缺乏相同的训练数据,外界也难以复现其能力,更无法实现迭代创新。因此,他呼吁,在AI时代,开源必须伴随着数据的开放,否则将陷入“无米之炊”的困境。
面对这些挑战,多位专家提出,构建更高维度的“开放”解法成为当务之急。开放数据的核心在于有条件共享,旨在释放数据价值以支撑AI训练和科研分析。例如,医疗数据在去除隐私信息后可开放给科研使用,但需遵守严格的场景限制和脱敏处理原则。
专家们强调,开放具有长远价值,其范畴涵盖标准、API、平台等多个维度。AI时代,开放架构比单纯开源代码更能推动二次创新,适应AI快速迭代的需求。中国工程院院士、原副院长陈左宁指出,设计精良的开放架构可能比完全公开的源代码更有意义,它将不同创新者在各自擅长的领域便捷接入,构建高效创新生态。
本次大会由中国计算机学会(CCF)主办,上海交通大学和CCF开源发展技术委员会承办,为业界提供了一个深入交流与合作的重要平台。