推荐|不知道这些AI知识,千万别说你是AI圈的!

AI百科5个月前更新 快创云
47 0

  摘要:为何人工智能与机器学习突然成为热门话题,不仅限于IT领域,更渗透至其他领域,成为众人热议的焦点?或许本文能为你揭示这一现象的缘由。

  近期,笔者有幸与人工智能领域相关企业的决策者进行深入交流。这些高管纷纷表示,他们已接到投资者关于机器学习战略及其现有项目状况的询问。那么,究竟是什么原因使得机器学习成为公司董事会热议的话题呢?

  众所周知,计算机自诞生之初便被设计为辅助人类解决各种问题的工具。传统的软件工程通过编写程序来应对特定问题,即我们向计算机提供解决某类问题的算法,并让它执行。在现实中,许多问题可被抽象为某种算法。例如,在小学算术中,我们使用加法来解决计数问题。一旦现实问题被转化为算法,计算机便能以超乎人类的速度和效率进行执行。

  然而,人们逐渐意识到这种方法的局限性。对于图像识别等复杂问题(例如判断照片是否为猫),人类可以轻易识别,但要将这类问题转化为高效算法却颇具挑战。由于对象的特征可能被隐藏,我们不能仅凭“有四条腿”或“有两只眼睛”来判断照片是否为猫。此外,照片可能仅显示猫的部分,使得问题更加复杂。

  这些对于传统编程来说的难题恰恰是机器学习的优势所在。我们无需明确告诉计算机如何解决问题,而是使用样本来训练计算机,使其自行学习算法。通过大量标记为猫的照片(有监督学习),计算机得以进化,最终能够识别各种猫的图片。

  与传统软件工程不同,机器学习中的计算机关注神经网络中的边际权重,这与人类大脑的学习过程相似,依靠神经元的相互通信来完成。而人类很难全面解释这种具有边际权重的网络。在此背景下,深度学习应运而生并大获成功。作为机器学习方法的一种,深度学习已成为人工智能的重要学科,也是计算机科学研究的主要分支之一。早在2012年,一个由16,000台计算机组成的Google研究网络便成功处理了千万级视频图像,以识别猫或任何指定对象,其中便采用了深度学习技术。

  许多现实世界的问题更需通过机器学习解决。这是因为许多问题需要我们发现数据中的特征或模式,例如从图像中识别对象、从语言中提取目标文本、从交易数据中检测欺诈行为等。

  以传感器数据监测为例,我们拥有众多传感器发送和接收数据。为确保其正常工作,需进行实时监测。一旦某台机器出现故障,需立即处理。通过监测数据流中的固定模式,我们可在日常运行中检测这些模式,从而提前预测可能的故障,提高运维效率。

  尽管机器学习的原理并不新颖,但它正日益受到追捧。这得益于三个主要原因:首先,大数据技术的发展为我们提供了充足的样本数据用于训练计算机;其次,前所未有的计算能力特别是云计算的普及;第三,一系列开源项目使得几乎每个人都可以利用这些机器学习算法进行研发。

  机器学习并非传统软件工程的替代品,而是对其的有力补充。它提供了许多有用工具,使我们能够解决更多传统软件工程无法解决的问题。机器学习带来了新机遇,同时现有系统也越来越多地采用这一技术。

  例如,遵循模式的重复操作是一个典型应用。一个应用系统可能拥有上百个功能,但用户每天通常只使用几个功能。通过观察用户操作步骤,计算机可学习并预测用户的下一步操作,提高效率。另一个例子是数据分配和转换(如用于填充数据仓库的ETL作业),计算机在此过程中学习重复的数据和对象,并自动化步骤以提高性能。

  在其他领域同样存在类似场景:如为不同学生定制个性化学习材料(特别是MOOC课程)、疾病的早期诊断、精准定位在线营销目标群体、自动识别数据质量问题以及在线交友网站的自动匹配等。

  由于其出色功能,Spark(与Hadoop组合)已成为机器学习主流的大数据框架。Talend也在这一方向上发展并更进一步采用更高效的建模作业以降低复杂性同时保持技术独立性。由于这些技术不断改进因此只有少数专家能熟练运用。尽管如此普及机器学习概念同样重要从大量样本中发现模式拓展了计算机可解决问题的范围具体来说是自动化决策过程这正是计算机学到的内容:从训练数据中积累知识并利用这些知识对新数据做出决策。一方面我们可以直接利用机器学习的训练结果让决策过程更智能、更准确;另一方面我们也可以对其他领域的机器学习结果进行分析、改进以适应自己的业务领域。总而言之如今计算机不仅遵循明确指令(如算数计算)还可通过样本来学习(如图像识别)。在不同场景下这两种方法各有特点和优势但若能结合两者或许在人工智能方面会取得更大进步。

© 版权声明

相关文章