追觅电视重磅硅谷成功发布变形电视+ Soundbar within刷新视听体验

发布时间：2026/04/29

4月27日至30日，追觅科技在美国旧金山成功举办“DREAME NEXT”硅谷全球发布会。为期四天的发布汇聚了全球媒体与科技从业者，成为近年来中国品牌在硅谷最具规模的发布事件之一。在本次发布会上，追觅电视正式面向北...
脱发难题有新招：振东制药达霏欣推出“内服外治”方案，助力毛囊新生

发布时间：2025/07/24

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
“大健康”中医药技术壁垒下，振东制药靠“一问一答”成功破局

发布时间：2025/06/26

6月17日，中国药理学会党委书记杜冠华率专家团队赴振东制药开展专项技术对接，全国学会服务地方产业发展项目正式启动。此次会议聚焦中药现代化研发重难点，诚邀全国中医药专家共同讨论“大健康”新时代背景下传统药...
振东出题，专家解题：“大健康”背景下，振东制药率先“破冰”！

发布时间：2025/06/25

6月17日，全国学会服务地方产业发展试点项目正式落地山西。该项目由中国科协主导，振东制药协办，研发总裁游蓉丽主持。旨在通过嫁接全国学会的学术资源助力山西地区药企实现技术升级，推动当地中医药企业集群全面...

“酷”大脑研究的扭曲观念扼杀了心理治疗

发布时间：2020/03/31

‘对于人类的每一个问题，总是存在着众所周知的解决方案-简洁，合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且，不乏任何试图探究其深度的简洁，合理和错误的答案。在我职业生...
SpaceX赢得NASA合同，使用新型Dragon XL工艺将货物运送到月球网关

发布时间：2020/03/31

美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船，用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本，将作为第一批从NASA获得...
Spaces应用程序使人们可以参加VR中的Zoom会议

发布时间：2020/03/30

一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。该应用是根据最近发生的COVID-19大流行而开发的，该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...
汇盈医疗声称其AI可以从CT扫描中检测冠状病毒，准确率达96%

发布时间：2020/03/30

总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案，该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言，如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法)，...

Google的AutoFlip使用AI为您裁剪视频

发布时间：2020/02/14 科技 浏览次数：961

为电视拍摄和编辑的视频通常是在横向上创建和观看的，但是问题在于，纵横比(例如16：9和4：3)并不总是适合用于观看的显示器。幸运的是，谷歌正在对此案进行调查。今天，它详细介绍了AutoFlip，这是一种用于智能视频重新成帧的开源工具。给定视频和目标尺寸，它会分析视频内容并制定最佳的跟踪和裁剪策略，然后以所需的宽高比生成具有相同持续时间的输出视频。
正如Google Research高级软件工程师Nathan Frey和高级软件工程师Zheng Sun在博客中所指出的那样，传统的视频重帧方法通常涉及静态裁剪，这通常会导致效果不理想。更好的定制方法是更好的方法，但是它们通常需要视频管理者手动识别每个帧中的显着内容，跟踪它们在帧之间的过渡，并在整个视频中相应地调整裁剪区域。
相比之下，由于AI对象检测和跟踪技术能够智能地理解视频内容，因此AutoFlip是完全自动的。系统检测表示场景变化的构图变化，以便隔离场景进行处理。在每次拍摄中，它主要通过选择优化的摄像头模式和路径，使用视频分析来确定场景重新定位之前的显着内容。

为了检测视频中的镜头何时发生变化，AutoFlip计算每个帧的颜色直方图，并将其与先前的帧进行比较。如果框架颜色的分布以与滑动历史窗口不同的速率变化，则发出镜头变化的信号。 AutoFlip会在决定重新构图之前缓冲视频直到场景完成为止，以便为整个场景优化重新构图。
AutoFlip还利用基于AI的对象检测模型来查找框架中有趣的内容，例如人，动物，文本叠加层，徽标和运动。人脸和物体检测模型通过MediaPipe与AutoFlip集成在一起，MediaPipe是一个框架，该框架可以开发用于处理多峰数据的管道，该管道在处理器上使用Google的TensorFlow Lite机器学习框架。据Google称，这种结构使AutoFlip可以扩展，因此开发人员可以为不同的用例和视频内容添加检测算法。
Google自动翻转
AutoFlip会根据对象在场景中的行为方式自动选择一种重新构图策略-固定，平移或跟踪。在静止模式下，重新构架的摄像机视口固定在一个位置(如静止的三脚架)，在该位置可以在整个场景的大部分时间内查看重要内容。另一方面，“平移”模式以恒定的速度移动视口，而“跟踪”模式则可在对象在框架内四处移动时提供对对象的连续和稳定的跟踪。
根据选择的重新构图策略，“自动翻转”为每个帧确定一个裁剪窗口，同时保留感兴趣的内容。配置图提供了用于重新构图的设置，以便在无法覆盖所有所需区域的情况下，系统将通过应用信箱效果，填充图像以填充框架来自动切换到较不积极的策略。 “自动翻转”将使用背景颜色(如果是纯色)绘制以确保填充混合，否则将使用原始帧的模糊版本。
Google自动翻转
研究人员留给未来的工作，以提高AutoFlip检测“与视频意图相关的对象”的能力，例如采访中的说话者检测或卡通上的动画人脸检测，并确保输入的视频在屏幕边缘覆盖(例如文字或徽标)不会从视图中裁剪出来。但是他们断言，即使以目前的形式，AutoFlip也将“减少……设计创造力的障碍。”
“通过结合文本/徽标检测和图像修复技术，我们希望未来版本的AutoFlip可以重新放置前景对象，以更好地适应新的宽高比。 [并且]在需要填充的情况下，深度的非裁剪技术可以提供更好的扩展能力，使其超出原始可视区域。” Frey和Sun写道。 “我们很高兴直接向开发人员和电影制片人发布此工具，从而减少了其设计创意的障碍，并通过视频编辑自动化达到了这一目标。随着视频内容消费设备的多样性不断迅速增加，使任何视频格式适应各种宽高比的能力变得越来越重要。”

上一篇: 苹果寻求专利机器学习修正GPS估算值

下一篇: Intuition Robotics融资3600万美元，将AI同伴带给所有人

相关推荐