ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

一点资讯王元元:如何避免陷入算法陷阱

时间:2018-05-22 11:15:03来源:互联网编辑:星辉

上周末,2018全球人工智能技术大会(GAITC)在北京国家会议中心举行。大会以“交叉、融合、相生、共赢”为主题,力图用新技术和科研成果绘制出最为清晰的AI新时代版图。

会上,一点资讯技术副总裁王元元作了题为“信息流中的算法”的主题演讲,并在随后的互动环节中提醒年轻的工程师们,要用更长远的眼光来优化算法,如果简单粗暴处理,算法的上限会非常明显。

算法助力信息流

从门户网站到自媒体兴起,如今网络上每天产生的内容数以百万计。王元元指出,信息流在某种意义上成为移动互联网时代搜索的下一代,并通过算法取得巨大成功,其原因有两个要素:

一、同样都是信息分发,信息流领域有“清晰和简单”的业务目标和商业目标。平台的目标可以转换成用户的时长、用户的刷新次数、用户的广告点击次数、用户的广告转换的次数。

二、流量越大,数据规模越大,反过来对达成更好的业务目标提供了非常重要的数据基础。

王元元介绍说,一点资讯现在拥有5900万日活,自媒体作者有68万+,每天产生接近五六十万的包括短视频、图文的内容。这些提供了非常重要的内容基础。再加上每天人均接近1小时的使用时长,用户产生了极其丰富的数据供工程师们进行优化。

“我从2012年开始做信息流相关的创业,经历了信息流行业的兴起、快速发展的阶段,”王元元介绍说,算法目前主要用于处理以下问题:

一、内容结构化是否成熟?从早期的热词和主题的分析,再到后期对内容质量的分析、权威度的分析、热度的分析,都是在对内容进行更深一步的理解,进行更多的结构化的工作。

随着数据量的膨胀,系统对推荐内容的理解需要从传统的简单结构分析过渡到更多的富有“人的知识“的结构判定,这样的结构背后所要做的算法工作十分庞大。

二、用户画像是否全面?平台需要利用用户的行为,包括用户和产品的交互行为去分析用户的一些基础特征,包含用户的人性属性特征、兴趣特征。

三、分发过程是否精准?用到的算法包括协同过滤、相关性模型、点击率模型,这些是在搜索开始非常常见的问题。但是在信息流领域中,它可能结合着信息流的特点,有一些新的工作。协同过滤的推荐是在数据达到一定规模之后,会让分发效率有一次质的飞跃,用户都会觉得看到的内容更好玩、更有趣,协同过滤的效果是非常好的。

在一点资讯,“深度学习”的推荐技巧已经应用到整个内容分发层面,从技术上说,提升效率是算法和AI最擅长的。

效率和价值如何平衡:从单一化的休闲娱乐朝着多元化的价值满足过渡

然而,随着信息流行业的迅猛发展,信息流行业也遇到了监管问题。如果信息流单纯提供一些抓人眼球的内容,用户的黏性无法得到保证,监管风险也是非常巨大的。

如何平衡效率和价值?王元元指出,影响算法最关键的是两个要素:数据、目标。现在效率的来源是大数据,但如果只依赖数据,最后一定会出现“指标优化“的情况。以一点资讯算法工作为例,王元元认为:“我们并不以点击为单一目标,而是综合如分享、时长这样的目标,把一个单目标优化的问题变成了多目标优化的问题,这也是我们现在工作中一直在不停做的。”

事实上,一点资讯一直以来就选择了“用户正确”的路径。当多数平台全面拥抱机器算法时,以算法技术领先立足的一点资讯最先看到了“矫枉过正”的潜在风险,首家在业内提出了“人机结合”模式,让挣扎于“信息茧房”中苦不得脱的用户以尽量舒服的姿势满足眼睛和大脑对内容获取的需求。所谓“人机结合”是一点资讯算法和人工编辑的双重保障,是平台对优质内容和用户的双向尊重。让算法负责效率,让人工掌舵内容;由算法开拓用户对兴趣内容的边界,由人工把握对内容风险的控制。

青年科学家如何“智造”AI产业

在随后的圆桌论坛上,王元元还就AI的未来发表自己的看法:随着内容越来越丰富,用户的需求也越来越复杂,我们越来越需要借助于AI的理解能力,以及用AI的方法去满足。

作为一名青年算法工作者,他同时也对同行提出了一些建议:看到算法优势的同时,也要深入理解我们所面临要解决的问题。如果只去解决那些比较简单的问题,用的方法又比较粗暴,算法的上限会非常明显,同时很可能让我们这个行业都面临巨大的风险。

“近期以来看到,单纯强调算法短期效率让行业都遭受了一些困难,这个困难是非常大的。”他说,“在这个方面,AI的从业者应该在实际工作当中,更深入地思考、对算法的优化要更长远。”

更多热门内容
索尼宣布2024财年起全面加薪,主管级员工月薪最高涨超5万日元
【ITBEAR科技资讯】3月21日消息,索尼集团于今日发出公告,决定自2024财年起,全面提高索尼集团及其两家附属运营公司员工的薪酬待遇。据悉,此次薪酬调整将覆盖所有层级的员工。对于主管级别的正式员工,其月薪将有机会获得最高超过5万日元(折合人民币约2385元)的增幅,

2024-03-21

UWA联盟批准单层HDR图像格式新标准立项,小米华为等多家企业共同申请
【ITBEAR科技资讯】3月21日消息,世界超高清视频产业联盟(UWA联盟)近日正式批准了一项重要团体标准的立项申请。该标准名为《高动态范围(HDR)静态图像 第2部分:单层格式》,由北京小米电子产品有限公司联合中国电子技术标准化研究院、华为、腾讯、OPPO、荣耀等多家企业

2024-03-21

华为云胡玉海:盘古大模型解难题做难事,撬动新质生产力发展
2024年全国两会,“人工智能+”和“新质生产力”首次被写入政府工作报告,成为数字经济领域最热的关键词。AI大模型以其强大的通用人工智能能力,成为人工智能发展的重要里程碑,并且在两会期间引发全国人大代表、政协委员热议。AI大模型将如何推动中国产业升级?日前,华

2024-03-20

中国联通2024年2月“大联接”用户增长1100万,5G用户达2.66亿
【ITBEAR科技资讯】3月20日消息,中国联通近日发布公告,截至2024年2月底,其“大联接”用户累计到达数已突破10.13亿户。这一数字包括移动出账用户、固网宽带用户、固网本地电话用户、物联网终端连接以及组网专线用户等多个维度,展现了中国联通在通信服务领域的广泛覆

2024-03-20

台积电全力扩增3nm产能,预计年底前利用率达80%
【ITBEAR科技资讯】3月19日消息,据台媒《经济日报》报道,全球半导体代工巨头台积电正计划在今年全力扩增其3nm制程的产能。据悉,该公司预计将在年底前将该制程的产能利用率提升至80%,以满足不断增长的市场需求。目前,台积电已经成功获得了苹果、高通、联发科等科技

2024-03-19