Apache MXNet Blog

谁才是最强的视频动作识别算法？

22 Dec 2020 · 朱毅 Amazon Applied Scientist

2020短视频继续爆发式发展，对视频理解的需求也继续猛增。不论是搞科研，还是项目落地，如何选择一个合适自己应用场景的视频模型至关重要。然而，论文满天飞，SOTA年年变，到底该怎样快速上车视频风口呢？在这次GluonCV 0.9.0发布中，我们不仅提供了针对视频动作识别可复现的模型库 (46个模型，支持PyTorch和MXNet)，易上手的教程（特征抽取，模型微调，FLOPS计算），还有涵...

GluonCV 0.8 助力街景分析

09 Sep 2020 · 朱毅 Amazon Applied Scientist

街景分析是计算机视觉应用最广泛的一个领域之一，越来越多的项目正在围绕街景展开，比如生成一个交互式的虚拟城市，建造一个属于自己的无人车等等。最近，OpenBot项目的推出大大降低了小机器人成本。一部旧的智能手机加上一个电动车身，不到400软妹币，你就可以造出一个先进的小机器人，行人跟踪和自主导航都不在话下。想必很多人都很心动，正准备打造一个属于自己的无人车吧。基于这波热潮，我们在GluonCV...

AWS AI全面助力视频理解，GluonCV 0.6轻松复现前沿模型

13 Jan 2020 · 朱毅 Amazon Applied Scientist

视频理解是近几年非常流行的研究方向，因为视频是最接近于人眼的真实输入，分析时间序列上的图像变化有助于我们开发更强的计算机视觉。而在视频理解领域，最具代表性的研究方向就是动作识别。区别于以往的大部分图像任务，动作识别的主体是动作，而不是物体，比如唱，跳，rap，篮球。所以动作识别功能可以为我们做些什么呢？现在大部分手机相册都会自动标注照片，把图片分为家庭，自拍，庆祝等等类别，方便查找。...

GluonCV v0.5：15个新模型

19 Sep 2019 · 朱毅 Amazon Applied Scientist 金颢 Amazon Software Development Engineer

在用心听取用户反馈后，我们如愿在 GluonCV 0.5版带来如下的新特性: 新任务：视频人体行为识别新模型：MobileNetV3-Large（Top-1 accuracy: 75.3）和 MobileNetV3-Small（Top-1 accuracy: 67.7）新模型：更多 INT8 量化的语义分割模型新模型：用于姿态估计的 AlphaPose 模型新...

GluonNLP v0.7.1——BERT新装上阵

22 Jul 2019 · Faramarz Munshi、林海滨 Amazon AI 翻译：金颢 Amazon Software Development Engineer

GluonNLP [7] 再次升级！我们的0.7版本提供了在大型语料库上进行了预训练的BERT Base模型，其性能可与原论文中提供的BERT Large模型媲美。其他亮点包括在不同专业领域语料库上训练后的BERT、新模型（ERNIE、GPT-2、ESIM等）以及更多数据集。完整的发布文档请猛击这里。自从BERT进入NLP领域，整个NLP社区涌现了许多用于特定数据集和特定场景的BERT变...

神经网络推理加速之模型量化

02 Jul 2019 · 赵鹏, 陈新宇, 秦臻南, 叶军翻译：包怡欣（INTEL MLT TEAM）

1. 引言在深度学习中，推理是指将一个预先训练好的神经网络模型部署到实际业务场景中，如图像分类、物体检测、在线翻译等。由于推理直接面向用户，因此推理性能至关重要，尤其对于企业级产品而言更是如此。衡量推理性能的重要指标包括延迟（latency）和吞吐量（throughput）。延迟是指完成一次预测所需的时间，吞吐量是指单位时间内处理数据的数量。低延迟和高吞吐量能够保证良好的用户体验和工...

预知未来——Gluon时间序列工具包（GluonTS）

13 Jun 2019 · GluonTS团队 Amazon AI

我们很高兴地在此宣布Gluon Time Series(GluonTS)正式开源了！GluonTS是一个由亚马逊的科学家们开发的，用于构建、评估以及比较基于深度学习的时间序列模型的python工具包。GluonTS基于Apache MXNet的Gluon接口，为搭建时间序列模型提供更简洁高效的组件。本文将介绍GluonTS工具包的关键功能，并演示如何应用GluonTS来解决时间序列预测问题。...

GluonCV v0.4：更多更快

01 Apr 2019 · 张帜 Amazon Applied Scientist

GluonCV 0.3 版提供大量超越原论文精度的模型。0.4 版在此基础上引入了：新应用：全新的人体关键点检测模型更快的部署：新增 Int8 部署和经济适用型的删减版 ResNet（Pruned ResNet）系列更强的预训练模型：ResNext, SE_ResNext 模型系列（各种 80%～81+% 准确度的 ImageNet 预训练模型）支持 FPN 的 ...