• 谁才是最强的视频动作识别算法?

    2020短视频继续爆发式发展,对视频理解的需求也继续猛增。不论是搞科研,还是项目落地,如何选择一个合适自己应用场景的视频模型至关重要。然而,论文满天飞,SOTA年年变,到底该怎样快速上车视频风口呢?在这次GluonCV 0.9.0发布中,我们不仅提供了针对视频动作识别可复现的模型库 (46个模型,支持PyTorch和MXNet),易上手的教程(特征抽取,模型微调,FLOPS计算),还有涵...

  • GluonCV 0.8 助力街景分析

    街景分析是计算机视觉应用最广泛的一个领域之一,越来越多的项目正在围绕街景展开,比如生成一个交互式的虚拟城市,建造一个属于自己的无人车等等。最近,OpenBot项目的推出大大降低了小机器人成本。一部旧的智能手机加上一个电动车身,不到400软妹币,你就可以造出一个先进的小机器人,行人跟踪和自主导航都不在话下。想必很多人都很心动,正准备打造一个属于自己的无人车吧。基于这波热潮,我们在GluonCV...

  • AWS AI全面助力视频理解,GluonCV 0.6轻松复现前沿模型

    视频理解是近几年非常流行的研究方向,因为视频是最接近于人眼的真实输入,分析时间序列上的图像变化有助于我们开发更强的计算机视觉。而在视频理解领域,最具代表性的研究方向就是动作识别。区别于以往的大部分图像任务,动作识别的主体是动作,而不是物体,比如唱,跳,rap,篮球。 所以动作识别功能可以为我们做些什么呢?现在大部分手机相册都会自动标注照片,把图片分为家庭,自拍,庆祝等等类别,方便查找。...

  • GluonCV v0.5:15个新模型

    在用心听取用户反馈后,我们如愿在 GluonCV 0.5版带来如下的新特性: 新任务:视频人体行为识别 新模型:MobileNetV3-Large(Top-1 accuracy: 75.3)和 MobileNetV3-Small(Top-1 accuracy: 67.7) 新模型:更多 INT8 量化的语义分割模型 新模型:用于姿态估计的 AlphaPose 模型 新...

  • GluonNLP v0.7.1——BERT新装上阵

    GluonNLP [7] 再次升级!我们的0.7版本提供了在大型语料库上进行了预训练的BERT Base模型,其性能可与原论文中提供的BERT Large模型媲美。其他亮点包括在不同专业领域语料库上训练后的BERT、新模型(ERNIE、GPT-2、ESIM等)以及更多数据集。完整的发布文档请猛击这里。 自从BERT进入NLP领域,整个NLP社区涌现了许多用于特定数据集和特定场景的BERT变...

  • 神经网络推理加速之模型量化

    1. 引言 在深度学习中,推理是指将一个预先训练好的神经网络模型部署到实际业务场景中,如图像分类、物体检测、在线翻译等。由于推理直接面向用户,因此推理性能至关重要,尤其对于企业级产品而言更是如此。 衡量推理性能的重要指标包括延迟(latency)和吞吐量(throughput)。延迟是指完成一次预测所需的时间,吞吐量是指单位时间内处理数据的数量。低延迟和高吞吐量能够保证良好的用户体验和工...

  • 预知未来——Gluon时间序列工具包(GluonTS)

    我们很高兴地在此宣布Gluon Time Series(GluonTS)正式开源了!GluonTS是一个由亚马逊的科学家们开发的,用于构建、评估以及比较基于深度学习的时间序列模型的python工具包。GluonTS基于Apache MXNet的Gluon接口,为搭建时间序列模型提供更简洁高效的组件。本文将介绍GluonTS工具包的关键功能,并演示如何应用GluonTS来解决时间序列预测问题。...

  • GluonCV v0.4:更多更快

    GluonCV 0.3 版提供大量超越原论文精度的模型。0.4 版在此基础上引入了: 新应用:全新的人体关键点检测模型 更快的部署:新增 Int8 部署和经济适用型的删减版 ResNet(Pruned ResNet)系列 更强的预训练模型:ResNext, SE_ResNext 模型系列(各种 80%~81+% 准确度的 ImageNet 预训练模型) 支持 FPN 的 ...