人工智能行业术语

人工智能:一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新技术科学。它是计算机科学的一个分支。

机器学习:人工智能的核心,是让计算机系统能够从数据中“学习”并改进,而无需进行明确编程的科学。

深度学习:机器学习的一个分支,基于人工神经网络,特别是具有许多层(“深度”)的神经网络,能够自动学习数据中的复杂模式。

算法:为解决特定问题而设计的一系列清晰、有限的指令或步骤。在AI中,算法是模型学习和预测的基础。

模型:在机器学习中,模型是算法在训练数据上学习后产生的输出,它能够对新的、未见过的数据进行预测或决策。

数据:AI的“燃料”。可以是结构化的(如表格数据)、非结构化的(如文本、图像、音频)或半结构化的。

训练:使用数据集来调整模型参数,使其能够学习数据中规律的过程。

推理:使用训练好的模型对新数据进行预测或生成结果的过程。

参数:模型在训练过程中学习到的内部变量,如神经网络中的权重和偏置。

人工神经网络:模仿生物神经网络结构和功能的数学模型或计算模型,是深度学习的基础。

感知机:最简单的神经网络模型,用于二元分类。31. 前馈神经网络:信息从输入层单向流向输出层的神经网络,是最基础的神经网络结构。

卷积神经网络:专为处理网格状数据(如图像)而设计的神经网络,通过卷积层有效提取空间特征。

循环神经网络:专为处理序列数据(如文本、语音)而设计的神经网络,具有“记忆”能力,能捕捉序列中的时间依赖关系。

Transformer:一种完全基于自注意力机制的神经网络架构,彻底改变了自然语言处理领域,并逐渐扩展到其他领域。其并行计算能力远超RNN。

自注意力机制:Transformer的核心,允许模型在处理序列中的某个元素时,能够“关注”到序列中的所有其他元素,并计算它们的重要性权重。

大型语言模型:通常指在海量文本数据上训练的、包含数千亿甚至上万亿参数的Transformer模型,具有强大的自然语言理解和生成能力。

多模态模型:能够同时处理和理解多种类型数据(如文本、图像、音频、视频)的AI模型。

向量数据库:专门用于存储、管理和查询高维向量(嵌入向量)的数据库,是语义搜索、推荐系统和RAG应用的关键组件。

嵌入:将离散的、高维的数据(如单词、类别)映射到低维、连续的向量空间的技术。这些向量能捕捉数据之间的语义关系。

自然语言处理:人工智能的一个分支,研究如何让计算机理解、解释和生成人类语言。

自然语言理解:NLP的子领域,专注于让机器理解文本或语音的含义。

自然语言生成:NLP的子领域,专注于让机器以自然、流畅的方式生成人类可读的文本或语音。

大语言模型提示工程:设计和优化输入给LLM的提示词,以引导模型产生更符合期望、更高质量的输出的技术

检索增强生成:一种将信息检索与生成式AI相结合的技术。在生成回答前,先从外部知识库中检索相关事实,然后基于检索到的信息进行生成,以提高回答的准确性和时效性。

上下文学习:LLM的一种能力,即在不更新模型参数的情况下,仅通过在输入提示中提供少量示例,就能学会执行新任务。

计算机视觉:使计算机能够从图像或视频中获取信息、理解内容并做出决策的科学。

数据集:用于训练、验证和测试模型的数据集合。

训练集:用于调整模型参数的数据子集。

数据标注:为原始数据(如图像、文本)添加标签的过程,是监督学习的基础。

监督学习:使用带有标签的数据进行训练,让模型学习输入到输出的映射关系。常见任务有分类和回归。

无监督学习:使用没有标签的数据进行训练,让模型自行发现数据中的内在结构或模式。常见任务有聚类和降维。

半监督学习:结合少量有标签数据和大量无标签数据进行训练,以利用两者的优势。

框架:用于简化AI模型开发和训练的软件库,如TensorFlow, PyTorch。

模型即服务:将训练好的AI模型作为云服务提供,用户可以通过API调用模型功能,无需自行部署和维护。

API (应用程序编程接口):一组定义和协议,用于构建和集成应用程序软件。在AI中,API是调用模型服务的主要方式。

幻觉:指生成式AI模型(尤其是LLM)捏造事实、生成看似合理但与事实不符的信息的现象。

基础模型:指在大量、广泛的数据上进行预训练,能够适应多种下游任务的超大规模模型(如GPT系列、BERT、Llama系列)。

提示词:输入给生成式AI模型的文本指令,用于引导模型生成特定的内容或执行特定的任务。

生成式AI:能够根据学习到的数据模式,创造出全新内容(文本、图像、音乐、代码等)的AI。

AIGC (AI Generated Content):即“AI生成内容”,是生成式AI应用的直接产物。

自主智能体:能够感知环境、制定决策并自主执行行动以完成特定目标的AI系统。它通常具备记忆、规划和使用工具的能力。

知识图谱:用图的形式表示实体及其之间关系的知识库,为AI提供结构化的世界知识,增强推理能力。

机器人流程自动化:使用软件机器人来自动执行重复性、基于规则的业务流程。结合AI后,可以处理更复杂的非结构化任务。

数字孪生:为物理实体(如飞机发动机、工厂、城市)创建的虚拟数字模型,通过AI进行实时模拟、预测和优化。

量子计算:利用量子力学原理进行计算的新兴技术。理论上,它能在某些特定问题上(如分子模拟、特定优化问题)提供远超传统计算机的算力,可能为AI带来颠覆性变革。

奇点:一个理论上的时间点,届时人工智能的智能将超越人类智能,并引发不可预见的技术和社会变革。这是一个充满争议和哲学思辨的概念。

http://minhaas.com/yaoshiyulejieshao/548292.html

QQ咨询

QQ: