Python 扩展教程(1): 调用百度AI

AI百科5个月前更新 快创云
48 0

  自计算机问世以来,人类便渴望赋予计算机以人类的感知、意识、概念、思维及行为,从而使其能够替代人类进行工作。人工智能(AI)作为计算机科学的一个分支,专注于研究、开发、模拟与扩展人类智能的理论、方法、技术及应用。

  从研究领域和方法来看,AI可分为模式识别、自然语言处理、专家系统与机器人等。模式识别研究人类的视觉与听觉等,旨在分析并识别声音、图形与图像中的有意义事物。神经网络/深度学习是模式识别的主要技术方法,如今在声音识别与人脸识别等领域已取得了显著成效。

  自然语言处理则致力于研究人类语言,旨在分析并理解语言的含义,存储知识并回答问题。例如,ChatGPT利用神经网络技术进行自然语言处理,通过大参数级别的语言模型实现了惊人的效果。

  专家系统研究人类的逻辑与推理,利用知识、事实、规则、逻辑与推理来表达世界。而机器人则是带有感官与动作装置(如眼睛、手、脚等)的AI,目前已被广泛应用于工厂、办公、军事与家庭等领域,逐渐取代越来越多的人类工作。有预言称,未来的人类将变为生物人与机器人的融合体。

  尽管AI已有几十年的历史,但当前的AI仍处于弱人工智能水平,即仅在有限领域与有限环境下能超越人类。然而,未来某一天,强人工智能与通用人工智能(AGI)可能会出现,并在所有领域超越人类,这将是人类时代的一个奇点,人类将进入人+智能机器混合体的新时代。

  在国内,百度AI处于领先地位,并提供了免费试用服务。让我们从学习使用百度AI开始吧。以下是详细的步骤:

  1. 登录[https://cloud.baidu.com/],点击屏幕右上角的“注册”按钮,按照屏幕提示完成注册。注册是免费的,过程中需使用手机登录。
  2. 注册并登录后,点击屏幕右上角“帐号”,进入个人实名登记页面。(请注意:未实名无法领取AI免费资源)
  3. 完成实名登记后,点击屏幕左上角的“产品服务”,在出现的页面右侧找到“人工智能”。
  4. 点击“产品服务”下的“语音技术”,进入语音技术页面。点击“免费尝鲜”下的“去领取”按钮,然后在“待领接口”中选择全部,再点击最下方的“0元领取”。至此,“语音技术”的免费资源就领取成功了。
  5. 操作过程同上,领取其他各类AI的免费资源。具体步骤为:点击左上角“产品服务” -> “人工智能/文字识别” -> “免费尝鲜”下的“去领取” -> 领取全部;依此类推,领取所有其他AI资源。
  6. 在“概览”页中可查看各类AI的免费资源赠送量。例如,短语音识别免费量达15万次,对于开发学习及小型应用已足够使用。各类AI的免费量不同,具体数量请查看各类AI的“概览”页。
  7. 百度AI有一个并发限制(QPS),即每秒查询数量,指每秒可以执行的这一类AI的请求量。
  8. 创建一个应用:点击左上角“产品服务” -> “人工智能/语音技术”,在下方界面中点击“创建应用”下的“去创建”。在创建应用页面填写应用名称(随意填写),勾选所有相关选项(如“语音技术”、“文字识别”、“人脸识别”等),并将应用归属选择为“个人”,应用描述填写为“学习”。最后点击最下方的“立即创建”。
  9. 创建应用后获得API Key与Secret Key两个参数。在返回的应用列表中可看到创建的应用名称及其对应的API Key与Secret Key。将这两个参数复制并粘贴到文本文件中以备后续使用。这两个参数是调用API时必须使用的两个参数,每个应用有一对API Key与Secret Key用于身份认证。
  10. AI(Application Programming Interface)是一个平台提供给开发者的接口函数。不同平台提供的API形式不同:Windows提供Win32 API;IOS提供IOS API;Android提供Android API;而互联网平台(如百度云、阿里云、ChatGPT等)则提供自己的API。一般来说互联网平台以HTTP协议提供API称为Web API相当于平台提供一个网页URL开发者向该URL发起请求提交参数并取得结果。提供API的平台也会提供API开发文档。对于开发者来说调用互联网平台提供的API有以下几种方式:使用平台提供的SDK包;按API开发文档说明使用HTTP直接读写参数操作API也可形成自己的开发包。由于百度AI对于Python的SDK不好用示范代码也难读因此我编写了一个Python库用于操作百度AI。jojo-ai库是我编写的Python库用于操作AI API简单好用。请在命令行通过PIP安装:库的安装名称是jojo-ai使用时import ai即可。jojo-ai库依赖库包括requests安装时将自动安装完成。为了播放声音建议再安装playsound库使用jojo-ai库调用百度AI很简单就两步:首先使用jojo-ai库封装了百度AI提供的各种API对应的方法如语音识别对应asr()方法语音合成对应tts()方法等具体可参考jojo-ai库的文档及百度AI的API文档进行操作。此外还有几个英文缩写的说明:ASR (Automatic Speech Recognition)自动语音识别TTS (Text-To-Speech)文字转语音OCR (Optical Character Recognition)文字识别NLP (Natural Language Processing)自然语言处理。以下是例程:根据百度云开发文档操作百度API分两步:第一步凭API Key Secret Key取得access token;第二步凭access token按API的文档要求发起API请求取得结果。同理jojo-ai库就是采取HTTP实现对各个API的访问的其BaiduAI类将各个百度AI API封装好隐藏众多细节方便大家使用。
© 版权声明

相关文章