< 返回阿里灵杰

AI开放服务

阿里AI(阿里灵杰)依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。

所有AI产品

视觉智能

人脸人体

基于人脸人体的检测分析和比对技术,提供检测、定位、属性和比对等能力。应用于人脸AR、生物识别和认证、检索、照片管理等场景。

分割抠图

实现了发丝、高度镂空主体和复杂背景的分割抠图,满足人、货、场三种类型分割需求,应用于电子商务、零售、泛文娱、个人应用等场景。

图像生产

提供图像视觉质量增强,可灵活应用于摄影、艺术、广告、媒体等行业,满足老照片修复、图像去噪、图像质量矫正等业务需求。

视频生产

提供视频内容的编辑、生成、增强等能力。视频生产可广泛应用于互联网媒体、短视频、娱乐直播、在线教育、广电传媒等行业应用。

目标检测

对通用或指定的目标进行检测、识别、打标。广泛应用于安防、交通等行业内图像场景的目标检测与跟踪。

图像识别

可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,可广泛应用于数字营销、新零售、广告设计等行业场景。

离线SDK

离线SDK激活后即可在无网环境下工作,可根据业务需要进行灵活的上层业务开发,且所有数据都可以在设备本地运行处理。

智能语音交互

语音识别

全新自研端到端语音识别算法,为客户提供简单易用、超高识别准确率、多场景、精细化能力服务体验。

语音合成

将文本转化为自然流畅的拟人化语音,合成音真实饱满、富有表现力,参数灵活可配,MOS评分达到行业顶级。

语音分析

构建智能语音交互场景下的口语理解和对话系统,提供给开发者自纠错能力及对话定制能力。

文字识别

个人证照识别

个人证照类识别提供个人身份识别所需的身份证、行驶证、驾驶证、护照等证件的结构化识别服务。

车辆物流识别

车辆物流识别基于阿里云OCR深度学习,结构化识别车辆相关的各类证件识别,广泛应用于智慧停车、汽车交易、汽车保险等场景。

通用文字识别

通用文字识别可将常见文档图片中的文字信息按照原有的格式进行文本识别和还原。支持文档结构的版面分析,进一步提升识别准确率。

票据凭证识别

发票凭证系列提供企业报销所需发票的结构化识别,支持混贴发票的自动分割识别。如增值税发票、火车票、出租车票等常见票据。

企业资质识别

企业资质识别支持对营业执照、商标注册证等识别,可广泛应用于办公自动化、行业资料数字化等业务场景。

教育场景识别

教育试卷识别主要满足教育场景中试题题目、公式识别需求,为智慧教学场景下的板书识别、自动阅卷等应用提供关键技术能力。

多语言识别

通用多语言识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。

OCR 轻应用

轻应用是基于OCR技术实现的可视化、轻量化的SaaS工具应用, 旨在帮助用户快速解决相应场景的问题, 无需开发介入即可使用。

自然语言处理

NLP基础服务

为用户提供包括分词、词性标注、命名实体、情感分析、中心词提取等自然语言处理基础服务,可用于智能问答、舆情分析、内容推荐等场景。

文本结构化

通过文本理解与分析,将用户关心的关键核心信息进行提取,简化机械、重复性的工作,协助企业完成文档审阅及录入。

智能电商分析

基于阿里电商平台海量已标注数据,多维度分析电商场景文本,快速搭建和实现电商AI业务应用。

医疗文本理解

为电子病历、药品说明书等多源医学文本提供文本结构化、文本推理、智能文本生成等基础功能,快速搭建和实现医疗AI业务应用。

定制工具

面向低算法基础用户设计的NLP行业自适应标注、训练和服务平台,支持文本实体抽取、文本分类、商品评价解析等算法能力的定制。

地址服务

精准提取物流面单中的姓名、电话、地址信息,通过NLP辅助地址做自动填充和精准定位,生成标准规范的详细地址信息,大幅提升业务效率。

机器翻译

文本翻译

致力于解决全场景语言障碍,多领域适用,可快速实现一种语言到另一种语言的自动翻译。

文档翻译

多领域引擎灵活选择、多类型文档格式覆盖,译后文档保持原格式排版,降低译后编辑成本。

图片翻译

集成图像识别、机器翻译、图片合成等技术,可将图片中的文本内容进行识别、翻译,最终合成指定语种图片/输出结构化信息。

证件翻译

集成OCR图像识别、机器翻译功能,帮助解决标准卡证信息翻译问题。输入证件,即可输出证件的结构化中文和译文结构化信息。

语种识别

帮助您快速判断文本所属语言。结合机器翻译服务,可通过自动的语种识别,快速定位需要翻译的内容,有效提升整体效率。

人机协同翻译平台

提供文本、文档、图片、音视频多模态翻译平台,以及翻译项目、语料、术语、模型管理的一站式人机协同翻译平台。

离线翻译SDK

支持在无网或弱网环境下,通过设备本地的翻译模型实现实时翻译,可以实现秒级快速响应。

跨境电商语言工具

为跨境贸易平台及商家沉淀一套完整的全链路语言翻译及优化工具,覆盖应用国际化、网站拉新引流、购买转化、留存复购等环节。

智能增长

开放搜索

提供一站式智能搜索业务开发平台,提供充分开放的分布式引擎能力。

智能推荐

结合在电商、内容、视频直播和社交等领域的积累,提供个性化信息流服务。
视觉智能
人脸人体
分割抠图
图像生产
视频生产
目标检测
图像识别
离线SDK
智能语音交互
文字识别
自然语言处理
机器翻译
智能增长