12 月 7 日,由 infoQ 主办的 2018 ArchSummit 全球架构师峰会在北京举行。知乎合伙人、CTO 李大海受邀参会并发表主题演讲,分享了知乎在内容平台 AI 应用的创新经验。李大海表示,新内容时代面临信息过载及用户内容消费升级两大挑战,对于知乎来说,AI 算法技术创新和应用则是应对挑战的关键武器。
以 AI 为武器,应对信息双重挑战
李大海认为,近几年在移动互联网和科技驱动下,内容平台迎来黄金时代。但也不可避免的,出现很多问题和挑战,其中就包括:信息过载和用户内容消费升级。
首先,技术的进步让信息丰富且实时,也让超负荷接收信息成为一种常态。根据 IDC 预测,全球数据总量预计 2020 年达到 44 ZB。信息大爆炸,让人们花费更多的精力接收和处理信息,沉淀知识。
与此同时,用户的内容消费升级正在发生。但优质、有用的信息一直是稀缺品,低质、无用的信息却很容易泛滥。如何大幅度提升优质内容的绝对数量,扩宽优质内容的覆盖领域,并同时减少低质内容的产生,是内容平台的共同难题。
面对信息过载及用户内容消费升级两大挑战,知乎一方面通过个性化推荐和搜索缩短用户和内容之间的距离,让用户在知乎摆脱信息过载带来的负担和压力;另一方面从内容生产和内容治理等维度入手,加速优质的、稀缺内容的生产,压缩低质内容的传播空间。
在具体战术上,知乎通过问题路由技术实现了快速精准匹配问题与用户,信息流个性化推荐技术则推动了用户便捷获知感兴趣的内容,用户推荐技术基于用户兴趣和行为数据强化用户连接,瓦力算法机器人则通过识别不友善、低质内容,营造良好社区氛围。
连接用户与内容,打造 AI 驱动的智能社区
知乎从问答起步,经过 8 年的发展,已经成为一个综合性全民知识内容平台,涵盖 25 万个话题,2700 万个问题,1.2 亿个回答,月浏览量达到 290 亿。与此同时,知乎也将技术创新纳入核心战略。据李大海介绍,自 2016 年引入机器学习开始,知乎已经将 AI 算法贯穿到知乎内容与用户的各个环节和体验中,构建了“人与内容”、“人与人”、“内容与内容”三个维度的连接。
在“人与内容”的连接中,知乎做出了诸多尝试。其中问题路由上线之后,由系统推荐带来的应邀回答数比过去提升了 400%;采用 DNN 模型的知乎个性化推荐上线之后,知乎 Feed 流的人均阅读量和人均使用时长均增长了 50% 以上;而瓦力算法机器人对不友善、低质内容的识别精准度达到了 99.13%。这些技术应用,在一定程度上为信息过载及用户内容消费升级问题的解决提供了可借鉴经验。
知乎的技术还应用在“人与人”的连接中。李大海表示,知乎在用户连接方向的追求是“让人发现更多有趣的灵魂”,本质上是理解用户价值观、兴趣,通过推荐,让大家能在需要的时候找到最能解决自己问题的人,找到最有用的解答。据介绍,对于任何一个社区而言,用户与用户之间的连接是用户活跃度和归属感的重要影响因素。在这个问题上,知乎通过 Graph Embedding 模型对用户进行隐式表示的学习,计算出两个用户之间的亲密度、兴趣相似度,以此进行更精准的推荐,让用户更多地在社区里发生连接。
知乎社区内“内容与内容”的连接主要集中在知识图谱领域。知乎上的问题和回答相当于半结构的文本组织,里面蕴含了大量的有价值信息,但这些信息缺乏一个结构化的整理,知乎希望通过构建这样一个知识图谱,让越来越多的提问和回答中的有价值信息,能够以一种更结构化的形式表征出来。李大海透露,知乎目前构建了以话题、实体为核心的百万级节点、千万级边,构建了话题相关性图谱、话题上下位图谱、话题与实体的关系图谱等。并且知乎的知识图谱已经在首页、推荐和搜索等实际业务中得到了应用。
通过三大维度、多个领域的技术应用尝试,知乎让每个用户持有的信息都能高效地被发掘,每个用户的内容需求都能被快速地被发现并满足,内容的价值能在生产和流通中得到充分释放,从而构建一个由 AI 驱动的“智能社区”,让每个用户都能高效获得可信赖的解答。(一鸣)
免责声明:本网转载自其它媒体的文章,目的在于弘扬科技创新精神,传递更多科技创新信息,并不代表本网赞同其观点和对其真实性负责,在此我们谨向原作者和原媒体致以崇高敬意。如果您认为本站文章侵犯了您的版权,请与我们联系,我们将第一时间删除。