24小时联系电话:185 8888 888

科技
您现在的位置: 首页 > 科技 > 面向所有人的机器学习:如何使用网络摄像头在浏览器中实现姿势估计
  • “酷”大脑研究的扭曲观念扼杀了心理治疗

    “酷”大脑研究的扭曲观念扼杀了心理治疗

    发布时间:2020/03/31

      ‘对于人类的每一个问题,总是存在着众所周知的解决方案-简洁,合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且,不乏任何试图探究其深度的简洁,合理和错误的答案。 在我职业生...

  • SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    发布时间:2020/03/31

      美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船,用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本,将作为第一批从NASA获得...

  • Spaces应用程序使人们可以参加VR中的Zoom会议

    Spaces应用程序使人们可以参加VR中的Zoom会议

    发布时间:2020/03/30

      一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。 该应用是根据最近发生的COVID-19大流行而开发的,该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...

  • 汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    发布时间:2020/03/30

      总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案,该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言,如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法),...

面向所有人的机器学习:如何使用网络摄像头在浏览器中实现姿势估计

发布时间:2020/02/04 科技 浏览次数:589

 
事实证明,20世纪是机器学习领域呈指数增长的时代。谷歌大脑团队AlphaGo AI击败了多次世界冠军李·苏道尔(Lee Sudol),使计算机科学家们预测,这种具有3000年历史的古老的“围棋”游戏需要再过十年才能破解。
而且,顺便说一句,这款中​​文游戏的组合比宇宙中预测的原子要多,或者简而言之,不能仅通过进行所有可能的动作来赢得这款游戏,就像IBM Blue在1997年击败世界冠军加里(Gary)那样卡斯帕罗夫。
然后,OpenAI的机器人在DOTA2中的兴起以及其他有趣的(可能有害的)东西,如Deepfake。研究领域的ML蓬勃发展,从10年前每年提交100篇论文到2019年每天仅在arXiv上发表100篇论文。
但是,撇开一切,重点是ML是高度数学密集型的。
尽管TensorFlow和PyTorch之类的库在使ML对于所有开发人员均可访问方面做出了重大贡献,但我们仍然面临着陡峭的学习曲线,以了解如何创建模型,对其进行训练并保存以供以后用于我们的任务。
这就是ml5.js的用处,它是基于TensorFlow.js的库,该库于去年3月启动,使这一愿景进一步发展。
为什么是ml5.js
“ ml5.js的目标是使机器学习对艺术家,创意编码人员和学生的广泛受众来说是可访问的。该库提供对浏览器中机器学习算法和模型的访问。” —官方开发人员
在浏览器中。是!无需安装,这使您免去了安装多个数据科学库的麻烦,并确保所有功能都与您安装的版本保持一致,我相信这有时并非易事。
但是,我需要什么?
从此GitHub存储库下载代码。它有两个文件夹,一个用于使用摄像头作为输入来检测姿势,另一个通过视频文件作为输入来检测姿势。
VS Code(可选)以读取代码。
人体姿势估计简介
让我们举一个小例子。我们希望使用机器学习在文件夹中查找人脸照片,其中包含您最近的度假旅行中拍摄的所有照片。
因此,我们采用一个神经网络,它是一个机器学习模型(很棒的初学者视频,了解它是什么),使用其中带有随机人脸的大量数据对其进行了训练,然后使用相同的模型来检测人脸中的人脸。我们的文件夹。
这些天的神经网络比巴斯金和罗宾斯冰淇淋中的味道要丰富得多。 (如果您想知道,它是31。)有些擅长处理图像,有些擅长处理文本数据,有些擅长处理诸如声音之类的时间序列,等等。
在我们的案例中,我们使用卷积神经网络(也称为CNN)来处理图像。
ml5.js是TensorFlow.js的包装,后者还提供了PoseNet模型。一个现成的模型,其中预先训练了CNN,并以图像作为输入,并输出关键点热图和偏移矢量。