您的位置:首页 > 互联网

AI 是短视频平台的核心能力 快手其实是一家人工智能公司

发布时间:2018-09-25 15:44:35  来源:互联网     背景:

  如何将每位用户的注意力高效分配给海量丰富的短视频,而非集中在少数爆款之上,光靠人工运营的方法是不可行的,这必须通过人工智能技术来实现。

  AI 如何赋能短视频平台?

  这是快手科技AI技术副总裁郑文在极客公园「创新之火」活动上的演讲主题。从纯粹用于制作、分享 GIF 图的工具性应用,到如今成为日活跃用户量过亿,用户日均使用时长超一小时的新型短视频社区,这是快手七年走过的创业路。

  七年,快手用户累计发布短视频超过 70 亿条,从搞笑、幽默,游戏、娱乐,到各地风土、民情,内容各异。对于快手,不少人认为它只是一家短视频公司,短视频平台跟 AI 技术的关系并不大。

  但是,如何将每位用户的注意力高效分配给海量丰富的短视频,而非集中在少数爆款之上,光靠人工运营的方法是不可行的,这必须通过人工智能技术来实现。

  AI 技术让记录生活更有趣

  面对每日数以千万的新增视频,该如何将其精准匹配到用户眼前?快手 CEO 宿华曾形容,这是快手员工需要面对的前所未有的难题。为此,快手提出了一整套基于 AI 技术的解决方案,贯穿视频生产、内容理解,用户理解,系统分发等使用快手的每个环节。在极客雇主交流会现场,快手科技AI技术副总裁郑文说,AI 是快手连接内容生产与消费两个端口的核心能力。

  快手上线了一批爆款特效,像是叫做快手时光机的「变老」表情,可以在十几秒钟中,让视频中人物的容颜变成 60 年之后、还有可以实时进行肢体识别的舞蹈游戏、AR 换脸等等。这些玩法背后是快手对前沿 AI 技术的开发,涉及人体姿态估计、手势识别、背景分割等多个技术模块。这是在内容生产领域,快手努力将记录形式变得更加有趣的新尝试。

  用户通过快手 app 拍摄、上传了一段短视频后,后台机器会提取其内含的基本信息,诸如视频中人脸的性别、表情、颜值等,尝试理解视频内容。机器还会依照场景识别、物体跟踪、图像质量评估等维度,对图像进行分类。语音识别,也是机器理解视频的重要方面。机器会把语音转化成文字,通过文字理解视频表达的含义。快手多媒体内容理解(Multi-Media Understanding)部门利用 AI 技术通过感知和推理两个阶段来解读一个视频,首先感知获取视频的客观内容信息,进而推理获取视频的高层语义信息。

  像人把学到的知识存到大脑一样,我们把快手的内容整理并存储到快手知识图谱中,这样融合感知内容和知识图谱,就可以完成对视频高层语义及情感的识别。

  促使机器理解用户本身同样不可或缺。用户年龄、性别、是否使用 WiFi 等注册的基本信息,用户在使用快手时产生的大量行为数据,都将传输到一个深度学习的模型中用于机器训练,从而得到一组综合性的用户信息,以预测用户的喜好,个体用户之间的关联。

  快手如何破除「信息茧房」?

  让记录形式更有趣,让机器理解视频内容、深度洞悉用户,这是快手利用 AI 技术赋能短视频平台的试探。

  快手科技 AI 技术副总裁郑文说,作为前沿技术,人工智能在研发、执行过程中还没有一个非常成行的流程。根据自身发展情况,快手以问题为导向开展 AI 项目,首先明确需求,接着针对需求进行预研、收集数据、训练模型,之后才是相应的功能开发与产品化。

  人工智能与算法推荐曾引发一些争议,大众普遍认为,智能算法根据用户兴趣推荐内容,久而久之,用户便会被自己关心的事物围绕,失去对外部世界的整体认知,形成「信息茧房」。对此,郑文举例快手的推荐机制作答:快手的推荐给用户的内容,绝非仅仅用户最感兴趣的部分,而是会考虑到内容的多样性,在更广阔的领域发现感兴趣的内容。

  郑文举例说,比如在社区中,会有一些跟你比较相似但不完全一样的用户,那么他们喜欢的内容,你也有可能会感兴趣,这样就不是用户自己一个人去探索,而是成千上万相似但不同的人在一起探索。基于这个逻辑的分发系统,也可以真正顾及到长尾视频,让更多的人被看见。

  作为记录载体,短视频形态本身具备普惠性。它极大降低了信息交流门槛,通过技术赋能,让人们可以公平、有趣地记录与分享生活。在极客雇主的交流会现场,郑文说,记录生活能够提高人们的幸福感,在快手,人们可以看到更丰富的世界,而他们自己也能够被世界看见。

  今年四月,快手还与清华联合成立了未来媒体数据研究院。该院以清华软件学院与快手的技术难题攻关为基础,联合新闻学院、社会学系等开展社会人文领域研究,涉及计算机图形学、图像处理、大数据和人工智能等领域,以合作开放的姿态,探索技术赋能短视频的更多可能。






  声明:本文仅为传递更多网络信息,不代表本站观点和意见,仅供参考了解,更不能作为投资使用依据。


返回网站首页

本文评论
不会智能语音录入的表情包不是好输入法
年轻人喜欢Diss,Diss周一早会上收到的一分钟长语音信息,Diss“手癌”闺蜜慌慌张张打出......
日期:09-30
中兴通讯披露转让子公司进展 阿里巴巴将分期付款
中兴通讯25日发布公告披露向南京溪软企业合伙企业(以下简称“南京溪软”)转让所持控股子......
日期:09-26
苹果宣布拥护美国隐私立法 呼吁别增加APP开发者负担
据AppleInsider报道,在当地时间周三举行的国会听证会上,苹果负责软件技术的副总裁群波(Guy "Bud" ......
日期:09-27
腾讯架构调整,云业务战略升级
腾讯调整新的架构了,很多人还加了一个情感词,“终于又”。...
日期:09-30
光通信与5G不断结合 打造端到端网络
目前5G已成业界热议话题,而光通信虽然看起来没有像5G那样风头正盛,但是光通信技术作为5G的重要支......
日期:09-27
5G与AI缘何成今年PT展两大“吸睛”热点?
2018年9月26日,记者参加2018年中国国际信息通信展览会(简称PT展),一上午看遍大部分展台,入眼最多......
日期:09-27
AI透明度引发关注 科技巨头推工具解释算法决策过程
北京时间9月27日消息,人工智能技术的透明度和道德伦理问题正引发越来越多的关注,这促使云计算服务......
日期:09-27
斗鱼贯彻“游戏+”战略 各项数据全面领先行业
随着视频直播聚集流量的能力逐渐增强以及布局内容领域的不断爆发,直播平台在整体生态中的重要性及......
日期:09-30
合作伙伴上线“顺丰打车” 顺丰:未经允许 解除合作
顺丰北京区此前与搬运帮是有达成初步合作意向,但搬运帮未经顺丰允许,擅自借用顺丰品牌宣传自身业......
日期:09-27
零售电商行业的终极理想
从「CK商业逻辑研究院」的公众号看了一篇关于实体店的分析文章,里面关于实体店和电商的购买距离、......
日期:09-29
喜大普奔!微软商店开始支持Windows 10时间线
9月29日消息 微软已在最新的更新中为Microsoft Store添加了对Windows 10时间线的支持。这意味着你搜......
日期:09-29
互联网下半场,腾讯要围剿阿里云和头条系
蓝鲸TMT频道9月30日讯,腾讯宣布公司组织架构在时隔6年后迎来新一轮的优化调整,在原有七大事业群(B......
日期:09-30
腾讯6年后迎来新调整 互联网下半场能否突围阿里云
9月30日讯,腾讯宣布公司组织架构在时隔6年后迎来新一轮的优化调整,在原有七大事业群(BG)的基础上......
日期:09-30
Facebook发现安全漏洞:黑客可控制5000万用户账号
北京时间9月29日早间消息,Facebook周五宣布,该公司发现了一个安全漏洞,黑客可利用这个漏洞来获取......
日期:09-29
百度助力长春政务服务改革 高效信息传递帮助群众“最多跑一次”
9月26日,由中国城市和小城镇改革发展中心、百度知道、熊掌号、长春市人民政府联合主办的“便......
日期:09-26
Telegram出漏洞:默认设置下在用户通话中曝光IP地址
据外媒报道,Telegram是一款可以让用户在互联网上与其他用户展开加密聊天和通话的通信应用。这款程......
日期:09-30
子弹短信下载量出现暴跌 罗永浩出面回应
子弹短信的出现,让不少人眼前一亮,或许这将是一款发展潜力巨大的应用,所以在上市时,子弹短信受......
日期:09-30
中国教育40年 百度教育大脑首家AI教育实验室落户合肥
2018是中国改革开放的40年,也是中国教育不断发展的40年,中国把教育作为实现站起来、富起来、强起......
日期:09-24
百度与中国科技馆达成战略合作:用AI共建“智慧科技馆”
9月21日上午,百度公司与中国科学技术馆在北京签署战略合作协议,双方将借助各自在技术、资源方面的......
日期:09-21
腾讯战略调整 “内容+社交”新战略成行业利好
近日,有消息人士透露,腾讯近期或进行重大战略调整,不仅要转型to b市场,腾讯最具优势的内容+社交......
日期:09-30