有消息称,人工智能领域知名企业OpenAI正与训练数据公司Handshake AI展开合作,共同推动一项涉及第三方外包人员的数据收集计划。据相关报道,OpenAI要求这些外包人员提供其过往及当前工作中的真实成果,以获取高质量训练数据。
近年来,人工智能行业呈现出一种趋势:各大公司纷纷通过聘请外包人员来生成用于模型训练的数据。这一战略布局的背后,是各企业希望借助这些数据,最终实现旗下模型对更多白领工作的自动化处理。OpenAI此次的行动,正是这一行业趋势的具体体现。
具体而言,OpenAI在一份演示文稿中明确要求外包人员详细描述自己在其他工作中执行过的任务,并上传“实际完成的真实职场工作成果”案例。这些案例需要是具体的产出物,而非文件摘要,涵盖Word文档、PDF、演示文稿、Excel表格、图片以及代码仓库等多种形式。
为确保数据收集的合规性,OpenAI要求外包人员在上传这些成果前,必须删除其中包含的专有信息和个人身份信息。为此,OpenAI还向他们推荐了一款名为ChatGPT“超级清洗工具(Superstar Scrubbing)”的应用,以协助完成这一操作。
然而,这一数据收集方式也引发了知识产权方面的担忧。知识产权律师埃文・布朗在接受采访时指出,任何采用这种模式的人工智能实验室都“正将自身置于极高风险之中”。他解释说,这种模式高度依赖外包人员自行判断信息是否属于机密,一旦出现疏漏,可能引发严重的法律问题。
针对这一报道,OpenAI发言人拒绝发表评论,未对相关事宜作出进一步回应。