追觅电视重磅硅谷成功发布变形电视+ Soundbar within刷新视听体验

发布时间：2026/04/29

4月27日至30日，追觅科技在美国旧金山成功举办“DREAME NEXT”硅谷全球发布会。为期四天的发布汇聚了全球媒体与科技从业者，成为近年来中国品牌在硅谷最具规模的发布事件之一。在本次发布会上，追觅电视正式面向北...
脱发难题有新招：振东制药达霏欣推出“内服外治”方案，助力毛囊新生

发布时间：2025/07/24

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
“大健康”中医药技术壁垒下，振东制药靠“一问一答”成功破局

发布时间：2025/06/26

6月17日，中国药理学会党委书记杜冠华率专家团队赴振东制药开展专项技术对接，全国学会服务地方产业发展项目正式启动。此次会议聚焦中药现代化研发重难点，诚邀全国中医药专家共同讨论“大健康”新时代背景下传统药...
振东出题，专家解题：“大健康”背景下，振东制药率先“破冰”！

发布时间：2025/06/25

6月17日，全国学会服务地方产业发展试点项目正式落地山西。该项目由中国科协主导，振东制药协办，研发总裁游蓉丽主持。旨在通过嫁接全国学会的学术资源助力山西地区药企实现技术升级，推动当地中医药企业集群全面...

“酷”大脑研究的扭曲观念扼杀了心理治疗

发布时间：2020/03/31

‘对于人类的每一个问题，总是存在着众所周知的解决方案-简洁，合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且，不乏任何试图探究其深度的简洁，合理和错误的答案。在我职业生...
SpaceX赢得NASA合同，使用新型Dragon XL工艺将货物运送到月球网关

发布时间：2020/03/31

美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船，用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本，将作为第一批从NASA获得...
Spaces应用程序使人们可以参加VR中的Zoom会议

发布时间：2020/03/30

一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。该应用是根据最近发生的COVID-19大流行而开发的，该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...
汇盈医疗声称其AI可以从CT扫描中检测冠状病毒，准确率达96%

发布时间：2020/03/30

总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案，该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言，如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法)，...

SenseTime的AI生成逼真的Deepfake视频

发布时间：2020/01/19 科技 浏览次数：878

Deepfake(一种将人带入现有图像，音频记录或视频中，并用其他人的头像代替它们的媒体)变得越来越具有说服力。在2019年末，总部位于首尔的Hyperconnect的研究人员开发了一种工具(MarioNETte)，该工具可以使用网络摄像头和静态图像来操纵历史人物，政客或CEO的面部特征。最近，来自香港科技巨头SenseTIme，南洋理工大学和中国科学院自动化研究所的一个团队提出了一种方法，该方法通过采用音频序列来合成逼真的视频来编辑目标肖像素材。与MarioNETte相反，SenseTime的技术是动态的，这意味着它可以更好地处理以前从未遇到过的媒体。尽管涉及到深造的最新进展令人担忧，但结果令人印象深刻。
这项研究的共同作者描述了这项工作，指出“多对多”音频到视频翻译的任务(即，不具有源视频和目标视频的单一标识的翻译)是一项艰巨的任务。通常，只有很少数量的视频可用于训练AI系统，并且任何方法都必须应对受试者之间较大的音频视频变化以及对场景几何，材质，照明和动态的知识缺乏。
为了克服这些挑战，研究小组的方法是将表情参数空间或与训练开始之前设置的面部特征相关的值用作音频到视频映射的目标空间。他们说，这有助于系统比完整像素更有效地学习映射，因为表达式在语义上与音频源更相关，并且可以通过机器学习算法生成参数来进行操作。
在研究人员的框架中，生成的表情参数(结合目标对象的几何和姿势参数)为三维面部网格的重建提供了帮助，该网格具有与目标相同的身份和头部姿势，但嘴唇运动与源音频音素相匹配(声音上在感知上截然不同的单位)。一个专门的组件使音频到表达的翻译与源音频的身份无关，从而使翻译对于不同的人和源音频的声音变化具有鲁棒性。然后系统从人的嘴巴区域提取特征(地标)，以确保精确地映射每个动作，首先将其表示为热图，然后将热图与源视频中的帧合并，将热图和帧作为输入，以完成嘴巴区域。
研究人员说，在一项要求100名志愿者评估168个视频剪辑的真实性的研究中，其中一半是由系统合成的，合成视频的55%的时间被标记为“真实”，而90%的时间被标记为“真实”。基本事实。他们将其归因于其系统捕获牙齿和面部纹理细节的出色能力，以及嘴角和鼻唇沟等特征(嘴两侧的压痕线从鼻子的边缘延伸到嘴的外角)。。
研究人员承认，他们的系统可能会出于“各种恶意目的”而被滥用或滥用，例如媒体操纵或“散布恶意宣传”。作为补救措施，他们建议采取“保护措施”，以及颁布和实施立法来授权编辑视频。如此标记。他们写道：“站在开发创新技术的最前沿，我们努力开发方法来检测编辑的视频，作为对策。” “我们还鼓励公众充当哨兵向[当局]报告任何看似可疑的视频。共同努力，我们将能够在不损害公众个人利益的情况下推广尖端和创新技术。”
不幸的是，这些提议似乎不太可能阻止像上面描述的那样由AI产生的深层造假。阿姆斯特丹的网络安全创业公司Deeptrace在6月和7月的最新统计中发现了14698个互联网上的Deepfake视频，高于去年12月的7964个，仅七个月就增长了84%。令人不安的不仅是因为伪造品可能会在选举中被用来影响公众舆论，或将某人卷入他们未曾犯下的罪行中，而且还因为该技术已经产生了色情材料，并使成千上万的公司陷于瘫痪。美元。
为了对抗深造的传播，Facebook –以及Amazon Web Services(AWS)，微软，人工智能合作伙伴和康奈尔科技大学的学者;麻省理工学院牛津大学加州大学伯克利分校;马里兰大学学院公园分校;和纽约州立大学奥尔巴尼分校-共同领导了9月宣布的Deepfake检测挑战赛。这项挑战于12月启动，是在与Google内部技术孵化器Jigsaw合作生产的大型可视化深层假冒发布之后，Jigsaw被纳入了基准，可供研究人员免费使用以进行合成视频检测系统开发。今年早些时候，作为AVspoof 2019竞赛的一部分，谷歌公开了一个语音数据集，其中包含该公司的文本语音转换模型所说的短语，以开发可区分真实语音和计算机生成语音的系统。
伴随着这些努力，Facebook，Twitter和其他在线平台已承诺实施有关处理AI操纵的媒体的新规则。

上一篇: 门多合一视频智能锁：家庭安全的新高度

下一篇: Instagram取消了IGTV按钮，但只有1%的人下载了该应用

相关推荐