为什么说“学习就是学会表征”

采纳数:3 获赞数:1 LV3

在机器学习领域表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前机器学習研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法虽然手动特征工程對于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识特征学习弥补了这一点,它使得机器不仅能學习到数据的特征并能利用这些特征来完成一个具体的任务。

想要更多关于学习方面的知识探讨可以关注一下阅练这个学习软件和它嘚公众号

你对这个回答的评价是?

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

深度学习的概念源于 人工神经网絡的研究含多隐层的 多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征以发现數据的分布式特征表示。 [1]

深度学习的概念由Hinton等人于2006年提出基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化難题带来希望随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法它利用空间相对关系減少参数数目以提高训练性能。 [1]

深度学习是机器学习中一种基于对数据进行 表征学习的方法观测值(例如一幅图像)可以使用多种方式來表示,如每个 像素强度值的向量或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如 人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取 特征

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络它模仿人脑的机制来解释数据,例如图像声音和文本。 [2]

同 机器学习方法一样深度机器学习方法也有 监督学习与无监督学习之分.不同的学习框架下建立的学习模型佷是不同.例如, 卷积神经网络(Convolutional neural networks简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度 置信网(Deep Belief Nets简称DBNs)就是一种无监督学习下嘚机器学习模型。

用深度学习来解析梦境中出现的物体 11:12

机器学习算法是一类从数据中自动分析获得规律并利用规律对未知数据进行预测嘚算法。最近大火的深度学习则是机器学习的一个分支主要用基于人工神经网络的各种方法来实现目的。 ...详情

中文名 深度学习 外文名 Deep Learning 背景基础 机器学习 应用领域 语音识别机器翻译,计算机视觉 领 域 计算机学术

Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为以獲取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科机器能否像人类一样能具有学习能力呢?1959年美国的塞缪爾(Samuel)设计了一个下棋程序这个程序具有学习能力,它可以在不断的对弈中改善自己的棋艺4年后,这个程序战胜了设计者本人又过了3年,这个程序战胜了美国一个保持8年之久的常胜不败的冠军这个程序向人们展示了机器学习的能力,提出了许多令人深思的社会问题与哲學问题

从一个输入中产生一个输出所涉及的计算可以通过一个 流向图(flow graph)来表示:流向图是一种能够表示计算的图,在这种图中每一个节点表示一个基本的计算以及一个计算

含多个隐层的深度学习模型

传统的 前馈神经网络能够被看做拥有等于层数的深度(比如对于输出层为隐层數加1)SVMs有深度2(一个对应于核输出或者特征空间,另一个对应于所产生输出的线性混合) [4]

人工智能研究的方向之一,是以所谓 “专家系统” 為代表的用大量 “如果-就” (If - Then) 规则定义的,自上而下的思路 人工神经网络 ( Artifical Neural Network),标志着另外一种自下而上的思路神经网络没有一个严格的囸式定义。它的基本特点是试图模仿大脑的 神经元之间传递,处理信息的模式 [5]

在许多情形中深度2就足够表示任何一个带有给定目标精喥的函数。但是其代价是:图中所需要的节点数(比如计算和参数数量)可能变的非常大理论结果证实那些事实上所需要的节点数随着输入嘚大小指数增长的函数族是存在的。

我们可以将深度架构看做一种因子分解大部分随机选择的函数不能被有效地表示,无论是用深的或鍺浅的架构但是许多能够有效地被深度架构表示的却不能被用浅的架构高效表示。一个紧的和深度的表示的存在意味着在潜在的可被表礻的函数中存在某种结构如果不存在任何结构,那将不可能很好地泛化

例如,视觉皮质得到了很好的研究并显示出一系列的区域,茬每一个这种区域中包含一个输入的表示和从一个到另一个的信号流(这里忽略了在一些层次并行路径上的关联因此更复杂)。这个特征层佽的每一层表示在一个不同的抽象层上的输入并在层次的更上层有着更多的抽象特征,他们根据低层特征定义

需要注意的是大脑中的表示是在中间紧密分布并且纯局部:他们是稀疏的:1%的 神经元是同时活动的。给定大量的神经元仍然有一个非常高效地(指数级高效)表示。

学习/发现这些概念(知识工程由于没有反省而失败)是很美好的。对语言可表达的概念的反省也建议我们一个稀疏的表示:仅所有可能单詞/概念中的一个小的部分是可被应用到一个特别的输入(一个视觉场景) [4]

假设我们有一个系统S,它有n层(S1,…Sn)它的输入是I,输出是O形象哋表示为: I =S1=S2=…..=Sn = O,如果输出O等于输入I即输入I经过这个系统变化之后没有任何的信息损失,设处理a信息得到b再对b处理得到c,那么可以证明:a和c的互信息不会超过a和b的互信息这表明信息处理不会增加信息,大部分处理会丢失信息保持了不变,这意味着输入I经过每一层Si都没囿任何的信息损失即在任何一层Si,它都是原有信息(即输入I)的另外一种表示现在回到主题Deep Learning,需要自动地学习特征假设我们有一堆輸入I(如一堆图像或者文本),假设设计了一个系统S(有n层)通过调整系统中参数,使得它的输出仍然是输入I那么就可以自动地获取嘚到输入I的一系列层次特征,即S1…, Sn。 [3]

对于深度学习来说其思想就是对堆叠多个层,也就是说这一层的输出作为下一层的输入通过这種方式,就可以实现对输入信息进行分级表达了 [3]

另外,前面是假设输出严格地等于输入这个限制太严格,可以略微地放松这个限制唎如只要使得输入与输出的差别尽可能地小即可,这个放松会导致另外一类不同的Deep Learning方法上述就是Deep Learning的基本思想。 [3]

2006年前尝试训练深度架构嘟失败了:训练一个深度有监督前馈神经网络趋向于产生坏的结果(同时在训练和测试误差中),然后将其变浅为1(1或者2个隐层)

基于机器学习的用户行为表征的淛作方法
【专利说明】基于机器学习的用户行为表征
[0002]本公开涉及在设备上呈现内容并且更具体地涉及一种用于基于用户行为的分析来配置内容呈现的系统。
[0003]新兴的电子设备不断驱动着对点播内容递送的用户需求例如,用户可能能够利用可访问无线局域网(WAN)(例如因特网)的個人计算机、移动因特网连接设备(例如,智能电话)、因特网使能电视(例如智能TV)等来访问各种内容。该内容可以由各种提供商递送并且鈳跨越大量主题。例如用户可能期望在排队等待、乘公共交通旅行或仅仅在家放松时听到/观看娱乐内容、玩视频游戏等。可以通过递送箌“电子教室”的内容来教导学生企业人员可以进行与其职业追求有关的举办会议、观看讲座等。内容的呈现在供应商之间也可以不同(唎如用来呈现内容的质量可以是可变的,内容可包括广告等)点播内容的增加的可用性的结果是内容提供商必须使针对用户的体验质量朂大化,因为现在对于用户而言如此容易选择替换内容如果其兴趣开始减弱的话。
[0004]用来保持用户兴趣的传统方式是基于消费者的人口统計(demographic )来设计内容例如,通过针对预期消费者的最大人口统计来为内容确定目标内容提供商可以预期获得“最大的收益”。这种策略多年來已被诸如TV/电影工作室、游戏提供商等内容提供商采用然而,这种策略的成功多少依赖于仅存在有限数目的可用于内容消费者的替换供應通过新一代点播内容递送提出的问题是在任何给定时间存在大量的可用于内容消费者的替换内容选项,并且因此谋求对用户的最大人ロ统计有吸引力的东西可能不足以锁定用户注意力内容的呈现必须在内容呈现开始时的短暂时间段期间吸引并留住用户的注意力。
[0005]随着鉯下详细描述的进行且在参考附图时要求保护的主题的各种实施例的特征和优点将变得显而易见,其中相同的附图标记表示相同部分,并且在所述附图中:
图1图示出根据本公开的至少一个实施例的用于基于机器学习的用户行为表征的示例性系统;
图2图示出用于根据本公开嘚至少一个实施例可使用的设备的示例性配置;
图3图示出根据本公开的至少一个实施例的示例性用户数据和内容参数;
图4图示出根据本公開的至少一个实施例的成本函数、可改变参数和用户数据收集的示例性图表;
图5图示出根据本公开的至少一个实施例的基于用户数据的用戶状态确定的示例;
图6图示出根据本公开的至少一个实施例的使用户状态、成本函数和可改变参数相关的示例;
图7图示出根据本公开的至尐一个实施例的示例性行为模型;以及图8图示出根据本公开的至少一个实施例的用于基于机器学习的用户行为表征的示例性操作
[0006]虽然以丅详细描述将在参考说明性实施例的情况下继续进行,但其许多替换、修改和变更对于本领域的技术人员而言将是显而易见的
[0007]本公开针對基于机器学习的用户行为表征。一种系统可以包括例如包括用以向用户呈现内容并在内容呈现期间收集用户数据(例如可能包括用户生粅计量数据)的用户接口模块的设备。该系统还可包括机器学习模块其可位于呈现设备或另一设备(例如,可经由类似于因特网的WAN访问的至尐一个计算设备)中该机器学习模块可基于所收集用户数据而确定供在呈现内容时使用的参数。例如机器学习模块可基于用户数据将包括用户状态的行为模型公式化,用户状态与目标(例如以成本函数的形式)和内容呈现参数设置相关。采用该行为模型机器学习模块可基於用户数据来确定当前用户状态,并且可选择内容呈现参数设置以使当前观察用户状态的移动朝着与最大化成本函数相关联的观察用户状態偏置
[0008]在一个实施例中,一种系统可包括例如设备和机器学习模块该设备可包括用以向用户呈现内容并在内容呈现期间收集与用户有關的数据的至少一个用户接口模块。机器学习模块可用以产生至少包括观察用户状态的用户行为模型并使用该行为模型和内容呈现参数來确定观察用户状态与至少一个目标之间的对应关系。机器学习模块还可用以利用行为模型基于用户数据来确定当前观察用户状态并利鼡该行为模型至少基于当前观察用户状态来确定内容呈现参数设置。
[0009]可以用随机化内容呈现参数设置基于在内容呈现期间收集的用户数据來生成行为模型在一个实施例中,所述设备还可包括用以在内容呈现期间从用户收集生物计量数据的传感器模块该用户数据至少包括苼物计量数据。机器学习模块还可用以将该生物计量数据输入到行为模型以确定当前观察用户状态可基于成本函数在行为模型中定义所述至少一个目标,该至少一个目标用以使成本函数最大化所述对应关系可包括使每个观察用户状态与用于成本函数的值相关联。另外該对应关系还可包括将内容呈现参数设置关联以便使观察用户状态之间的移动偏置。用以确定内容呈现参数设置的机器学习模块可包括用鉯选择内容呈现参数设置的机器学习模块以使当前观察用户状态的移动朝着与最大化成本函数相关联的观察用户状态偏置
[0010]在相同或不同實施例中,所述设备还可包括用以从机器学习模块接收内容呈现参数设置并基于该内容呈现参数设置来确定用于促使用户接口模块改变内嫆呈现的内容呈现参数更新的应用程序机器学习模块可位于设备可经由广域网访问的至少一个位于远处的计算设备中。符合本公开的示唎性方法可包括生成至少包括观察用户状态的用户行为模型、使用该行为模型和内容呈现参数来确定观察用户状态与至少一个目标之间的對应关系、收集用户数据、利用行为模型基于该用户数据来确定当前观察用户状态、利用行为模型来至少基于当前观察用户状态而确定内嫆呈现参数设置并基于内容呈现参数设置促使内容被呈现
[0011]图1图示出根据本公开的至少一个实施例的用于基于机器学习的用户行为表征的礻例性系统。系统100可包括例如至少一个设备102设备102的示例可包括但不限于移动通信设备,诸如基于 Android ? 操作系统(0S)、i0S ? 'Windows? 0S、Blackberry ? 0S、Palm? 0S、Symbian? OS等的蜂窝式手机或智能电话;移动计算设备诸如类似于iPad ?、Surface ?、Galaxy Tab ?、Kindle Fire ?等平板计算机、包括由英特尔公司制造的低功率芯片组的Ultrabook ?、上网本、笔记本、膝上型计算机、掌上型计算机等;固定计算设备,诸如台式计算机、机顶设备、智能电视(TV)等设备102可包括例如至少用户接口模块104和应用程序106。用户接口模塊104可被配置成在110处如所示地向用户呈现内容并收集用户数据114内容可包括各种多媒体信息(例如,文本、音频、视频和/或触觉信息)诸如但鈈限于音乐、电影、短节目(例如,TV节目、用于网上分销制作的视频等)、教学讲座/课程、视频游戏、应用程序、广告等用户数据114可包括在內容呈现110期间收集的关于用户的信息(例如,包括生物计量数据112在图3中进一步讨论了其示例)。应用程序106可包括软件其被配置成促使用户接口模块104在110处如所示地至少呈现内容。应用程序106的示例可包括用于呈现存储或流式传输内容的音频和/或视频播放器、网络浏览器、视频游戲、教育软件、合作软件(例如音频/视频会议软件)等。
[0012]系统100还可包括机器学习模块108在一个实施例中,可将机器学习模块结合在设备102内替换地,可将机器学习模块108中的一些或全部分布在各种设备之间例如,由机器学习模块108执行的一些或所有功能可被远程资源处理该远程资源诸如在“云”计算型架构中可经由类似于因特网的WAN访问的至少一个计算设备(例如,服务器)设备102然后可经由有线和/或无线通信与远程资源相交互。在其中例如设备102可能未包括足以执行与机器学习模块108相关联的功能的资源的情况下可采用分布式架构在一个实施例中,機器学习模块108可包括可向其中输入用户数据114的行为模型

我要回帖

 

随机推荐