快捷搜索:  as  as`  MTU1OTcwNjExOA`  test  1111

麻省理工学院新研究:通过声音猜测人脸

【天极网收集频道】6月7日消息,麻省理工学院的钻研职员练习了一个机械进修模型,只需根据一段简短的音频剪辑,就能重修出一小我异常粗拙的面部轮廓。

麻省理工学院的钻研职员在Arxiv网站颁发的一项钻研中,创造了一种基于一小段音频剪辑来重修一些人粗拙边幅的措施。论文《Speech2Face:进修语音背后的面孔》,描述了他们若何从YouTube上获取数百万个剪辑组成的数据集,并创建了一个基于神经收集的模型,用于进修与视频中面部特性相关的声音属性。现在,当系统听到一个新的声音片段时,人工智能可以应用它学到的器械来预测人脸的样子。

麻省理工学院的钻研职员确凿承认了论文中的隐私问题,并在“伦理斟酌”部分化释说,Speech2Face经由过程练习可以捕捉性别和年岁等常见的视觉特性,并且只有当声音中有足够的证据时才这样做。换句话说,该系统并没有考试测验或能够天生特定人物的图像。

只管如斯,钻研职员推想,人工智能可能会支持一些利用,比如根据措辞者的声音在语音或视频通话中附加一个代表性的面孔。

当然,终极孕育发生的图像是异常粗拙的。但总体而言,此中许多照片的年岁、种族和性别都是精确的。之前的钻研已经探索了经由过程说话猜测年岁和性其余措施,但在这个案例中,钻研者声称他们也发清楚明了与一些面部模式的相关性。他们写道:“除了这些主要特性,我们的重修揭示了颅面部特性(如鼻子布局)和声音之间弗成漠视的相关性。”

从可以在照片中自动标注某人的算法,到输入的翰墨可以用某人的声音读出来,再到用一种措施从声音平分辨出人脸是什么样的,人工智能变得越来越强大年夜的同时,正让每个置身此中的人变得越来越透明,其带来的隐私问题值得我们关注。

您可能还会对下面的文章感兴趣: