话题集
PyTorch
FaceBook推出的深度学习框架
循环神经网络
循环神经网络(Recurrent Neural Networks,RNN),是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。不同于前馈神经网络的是,RNN可以利用它内部的记忆来处理任意时序的输入序列,这让它可以更容易处理如不分段的手写识别、语音识别等。
生成对抗网络(GAN)
生成对抗网络 (Generative Adversarial Network, GAN) 是一类神经网络,通过轮流训练判别器 (Discriminator) 和生成器 (Generator),令其相互对抗,来从复杂概率分布中采样,例如生成图片、文字、语音等。
卷积神经网络
卷积神经网络(Convolutional Neural Network,CNN),是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。卷积神经网络包括卷积层和池化层。
数据分析
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。
编程语言
程序设计语言 (Programming Languages) 又称编程语言,是一组用来定义计算机程序的语法规则。
人工神经网络
人工神经网络(artificial neural network)是一种运算模型,由大量的节点(或称神经元)之间相互联接构成,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
命名实体识别
命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。
TensorFlow
Google发布的第二代深度学习系统,可被用于语音识别或图像识别等多项机器学习和深度学习领域。
算法
在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。
DeepVariant
DeepVariant是Google公司在2017年12月5日推出的,用深度神经网络来从DNA测序数据中快速较精确识别碱基变异位点的开源工具。
深度学习
深度学习(Deep Learning,DL)机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
Kaggle
Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。
智能语音
智能语音,即智能语音技术,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。
Python
Python 是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。
数据结构
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。
注意力机制
注意力机制(Attention Mechanism)的核心目标是从众多信息中选择出对当前任务目标更关键的信息,常被使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。
分词
分词是将一个汉字序列切分成一个一个单独的词,是文本处理的基础。经过分词,以及应用某种表示方法,就可以将文本表示成数字向量,便于计算机理解和处理。
语义识别
语义识别是人工智能(Artificial Intelligence)的一个分支,是自然语言处理技术的几个核心任务,涉及语言学、计算语言学、机器学习,以及认知语言等多个学科。 语义识别指运用各种方法,学习与理解一段文本所表示的语义内容,任何对语言的理解都可以归为语义识别的范畴。语义识别的目标是通过建立有效的模型和系统,实现在各个语言单位(包括词汇、句子和篇章等)的自动语义分析,从而实现理解整个文本表达的真实语义。
文本分类
文本分类是指计算机对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记,属于一种基于分类体系的自动分类,是朴素贝叶斯分类方法。文本分类一般包括了文本的表达、 分类器的选择与训练、 分类结果的评价与反馈等过程,其中文本的表达又可细分为文本预处理、索引和统计、特征抽取等步骤。