视频AI产品
视频审核
基于海量标注数据和深度学习算法实现,多维度识别视频、封面、标题或评论的违禁内容。
视频DNA
可唯一标记一个视频,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。
视频智能生产
视频智能生产,是将视频AI的多种能力与视频云基础服务打通,赋能视频生产环节,提高视频生产的效率和质量。
视频多模态内容理解
综合分析视觉、文字、语音、行为等,自动输出视频多维度内容标签,将非结构化信息转化为结构化信息。
智能封面
通过对视频内容的理解,结合画面美学和海量用户行为数据,选出最优的关键帧或关键片段作为视频封面。
智能视觉
为零算法基础的开发者和企业提供定制化模型训练能力,应用于泛娱乐、视频监控、门店运营等各种产品。
视频AI的优势
稳定性
视频AI服务依托于阿里云强大的媒体处理能力,和丰富的客户业务服务经验,可以提供高稳定性和高靠性的多种视频AI能力。以视频DNA为例,拥有亿级视频DNA库维护能力,毫秒级检索效率,DNA数据可靠性99.999999%。
高准召
将达摩院的前沿人工智能算法能力与阿里云的强大大规模云服务能力结合,算法迭代效率高,拥有高准确率高召回率。算法、工程、产品、业务进行全面打通,真正从实际客户痛点出发,从实际场景出发,将技术最大化产出。
大计算大存储
视频AI利用计算、存储分离的方式,能同时提供服务高可用性和数据高可靠性。基于阿里云充足稳定的ECS计算资源,拥有弹性的扩容能力,支持海量视频的计算需求,同时基于阿里云成熟稳定的存储技术,能够存储海量视频内容,数据有极高可靠性的保障。提供用户级别的隔离,避免多用户之间业务的互相干扰,并确保用户数据独立性。在资源和工程能力上实现了对大计算大存储的可靠性保障。
定制化
针对业务对视频中不同种类的识别需求,视频AI不仅输出高准召的预测模型,还为业务提供模型训练能力,满足视频内容分析的各种定制化场景,做到真正的读懂视频。
应用场景
高精度视频审核
UGC短视频原创保护
视频智能生产
多模态内容理解
  • 高精度视频审核
  • UGC短视频原创保护
  • 视频智能生产
  • 多模态内容理解

高精度视频审核

视频智能审核服务(Video Cencor)基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别视频、封面、标题或评论的违禁内容,包括色情、暴恐、政治敏感、广告、视频黑库等多个功能模块,应用于短视频平台、直播平台、传媒审核等场景。

能够解决的问题

  • 大幅降低运营成本
    平均复审率低于10%,90%以上的审核人力可获解放。
  • 风险覆盖全
    对媒资封面、标题、评论、视频等全内容进行语音、文字、画面全维度的四大项审核。
  • 行业领先高召回率
    依靠阿里系海量特征数据沉淀,违规特征实时更新,拥有业内领先召回率。

视频DNA

视频DNA可以唯一标记一个视频,通常是一个二进制串。它具有唯一性,不同视频的视频DNA不同;它也具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。基于这些特性,视频DNA可被应用于短视频平台的查重、原创保护等场景中。

能够解决的问题

  • 视频查重
    建立独立视频DNA库,在该库中对样本视频完成快速比对,实时召回重复视频或重复片段。 防止内容分发和个性化推荐时,出现过多相同或相似视频,影响用户体验。
  • 原创识别
    准确识别是否为原创视频、编辑变换后视频、自媒体再创作视频。 解决短视频领域维权问题,为视频素材交易生态提供技术基础,防止侵权视频侵害原创者及视频平台利益。

实时直播字幕及监控

视频智能生产,是将视频AI的多种能力与视频云基础服务打通,赋能视频生产环节,提高视频生产的效率和质量。

能够解决的问题

  • 智能集锦
    针对体育赛事、综艺节目、晚会等对时效性要求较高的直播视频,利用多模态内容理解技术,进行精彩内容的识别、定位、剪辑、合理聚合,以实时产生精彩集锦。
  • 智能拆条
    基于丰富的视频AI能力,与点播云剪辑结合,对视频进行不同维度的智能化拆分,如人物维度、场景维度等,也可实现对新闻视频的智能化新闻拆条,高效产出更多独立素材。

视频多模态内容理解

视频多模态内容理解,是通过分析视频中视觉、文字、语音、行为等多模态信息,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。基于深度学习的目标检测技术,准确找出给定视频的视频帧中多目标及位置,并给出每个目标的具体类别。目标检测支持多达1000个类目, 包括: 生活用品、 交通工具、 动物、 植物等。

能够解决的问题

  • 特定目标匹配
    检测并识别特定类目的目标,可应用于对特定目标做有趣的交互;或对目标进行实时识别、定位、跟踪,用于智能监控系统、流量控制系统等场景。
  • 个性化推荐
    基于视频内容,快速预测和识别多维度视频标签,提高媒资后台管理效率,优化前端流量分发效果。
更多产品与服务
视频点播
视频点播(ApsaraVideo VoD,简称VoD)是集视频采集、编辑、上传、媒体资源管理、自动化转码处理(窄带高清TM)、视频审核分析、分发加速于一体的一站式音视频点播解决方案。
了解更多
媒体处理
媒体处理(ApsaraVideo Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
了解更多
视频直播
视频直播(ApsaraVideo Live)是基于领先的内容接入与分发网络和大规模分布式实时视频处理技术(含窄带高清TM)打造的音视频直播平台,提供易接入、低延迟、高并发、高清流畅的音视频直播服务。
了解更多
视网膜
视频AI线上免费体验馆
了解更多