uml.org.cn - TensorFlow??????????NLP
运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

Search Preview

运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

uml.org.cn
body { margin: 0px;padding:0 } #div1 { display: none; position: absolute; z-index: 1000; height: 100%; width: 100%; backgrou
.cn > uml.org.cn

SEO audit: Content analysis

Language

Error! No language localisation is found.

Title

运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

Text / HTML ratio

55 %

Frame

Excellent! The website does not use iFrame solutions.

Flash

Excellent! The website does not have any flash contents.

Keywords cloud

Keywords consistency

Keyword	Content	Title	Description	Headings

Headings

Error! The website does not use (H) tags.

Images

We found 102 images on this web page.

SEO Keywords (Single)

Keyword	Occurrence	Density

SEO Keywords (Two Word)

Keyword	Occurrence	Density

SEO Keywords (Three Word)

Keyword	Occurrence	Density	Possible Spam

SEO Keywords (Four Word)

Keyword	Occurrence	Density	Possible Spam

Internal links in - uml.org.cn

????
文章-火龙果软件工程

iProcess
iProcess--火龙果软件工程技术中心

?ֲ?ʽϵͳ?еĻ????ܹ?
一文深入了解：分布式系统中的缓存架构-数据库

BitbucketPipeline+AmazonS3
基于 Bitbucket Pipeline + Amazon S3 的自动化运维体系-IT运维管理

΢??΢???????ؿ???ϵͳ
DAGOR：微信微服务过载控制系统-移动端开发

???ݿ?
数据库-火龙果软件工程

IT??ά????
IT运维管理-火龙果软件工程

΢????
微服务-火龙果软件工程

????vuex??״̬????ģʽ?ܹ?
理解vuex的状态管理模式架构

TensorFlow??????????NLP
运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

web????
JavaScript-火龙果软件工程

?˹?????
人工智能-火龙果软件工程

????TensorFlow?ڲ?ʵ??ԭ??
从系统和代码实现角度解析TensorFlow的内部实现原理-人工智能-火龙果软件

ʹ??IPython??ǿ????ʽ????
使用IPython增强交互式体验-Python

?????Ͳ?????????????Ӧ??
在 IBM Cloud 上创建和部署区块链聊天应用

python
python-火龙果软件工程

?Ƽ???
云计算-火龙果软件工程

VUE.JS??????????ʵ??
VUE.JS组件化开发实践

???????ɵ?·????C++???߳̿???
瑞萨C++多线程开发培训-火龙果软件

?й????Ų?Ʒ????
产品经理产品管理培训| 产品经理培训

ծȯ???ۻ??? ʹ??Selenium?????Զ???
使用Selenium进行有效的自动化测试-火龙果软件-UML软件工程组织

????֤ȯ?߿????ƶ???̨?ܹ?????
高可用架构培训|软件架构培训-火龙果软件

E2Biz ????UML+EA ҵ????ϵͳ??ģ
基于UML+EA进行嵌入式系统分析设计培训-火龙果软件-UML软件工程组织

???Ź???????????ѵ
工作量估算管理培训-火龙果软件

????
培训案例-火龙果软件

??ΰ?? ͨ????????֤???????ܹ?ʦ
软件架构师认证|软件架构师培训-火龙果软件

???? ͨ????????֤???????ܹ?ʦ
软件架构师认证|软件架构师培训-火龙果软件

??ѧ?? ͨ????????֤???????ܹ?ʦ
软件架构师认证|软件架构培训-火龙果软件

???? ͨ????????֤???????ܹ?ʦ
软件架构师认证|软件架构师培训-火龙果软件

Githubʹ?ÿ???????
Github使用快速上手-配置管理

?? Vuex ????һ???ʼ?Ӧ??
用 Vuex 构建一个笔记应用 -web开发

???ù???
配置管理-火龙果软件工程

????matplotlib?????ݿ??ӻ?
基于matplotlib的数据可视化 -Python

OnlineLearning?㷨??????ʵ??
Online Learning算法理论与实践-火龙果软件

????
每月技术月刊--UML软件工程组织

????????
火龙果软件工程技术中心

??ϵ????
联系我们-UML软件工程组织

Uml.org.cn Spined HTML

��TensorFlow��򵥵�NLP��-�˹��-�� Ծ��֧��ǵĹ��ҵ�� 1Ԫ 10Ԫ 50Ԫ ��֤�룺 �� ֪ �� Ŀ� Lib ��Ƶ Code iProcess �γ� ��֤ ��ѯ �� ɳ�֮· ��Ա Ҫ�� ÿ��15ƪ�� ı�� ׷�� TensorFlow��򵥵�NLP�� 43 �� ۣ� �� 2018-11-30 �༭�Ƽ�: ��cnblogs��½��ģ�͡�ѭ��缰TensorFlow��֪ʶ�� ǰ��˹��ܡ��Ǽ̡��ݡ��һ��ٵĴʣ�ÿ�ҹ�˾��Ҫ��˹��ܣ��͸�4-5��ǰ��һ��ҵ��еĶ��ǳ��뵽֮ǰһ��˵��Ļ�� Big Data is like teenage sex: Everyone talks well-nigh it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims. ��ڿ��ġ�Big Data��Ի��ɡ�AI��ˣ��ڴ�һ�û��״��ݵ�ʱ��˹��ܾͿ�ʼ��һ��ˡ��Ÿ��̬�ȣ��Ҳ��ȥ��̽�� ǰ��ѧ��绹�ǹ�ҵ�磬��ѧϰ��ܵ��׷��Google��Դ��ѧϰƽ̨TensorFlow֮�󣬸��Ǹ��ѧϰ��Ͻ��͡�Ŀǰ�ڿ�Դ��Github��п�Դ��Ŀ�У�TensorFlow��Ϊ��Ծ��Ƴ��ڣ��˼��汾��ݽ��˵�ܹ��Ч�ؽ��ʵ��⡣��Ҫ��Բ��TensorFlow��Ȼ��Դ��(NLP)��ļ�Ӧ�ã��ô�һ��Ӹ��Ե��ʶTensorFlow�� ˵��NLP��ʵ�Ҷ��Ǻ��Ϥ��֮ǰҲδ��й�NLP��ؾ��飬��ѧϰTensorFlow��һЩ��ۣ��͵��ש��ˡ��ǰ��ÿ�춼�ڲ��ı��Ƶ��ݣ�ͨ��ھ��Щ��ݣ��ǿ��һЩ��ӱ�ݵ�Ӧ�ã��롢��ʶ�𡢴��Ա�ע�Լ��Ϣ��ȣ��Щ��NLP��롣��NLP��У��ģ��һ��ڣ��ҪΧ��ģ��չ��Ƚ��ԭ��(word2vec)��ѭ��(RNN)��ʱ��(LSTM)��ѧϰ��ģ�ͣ��ϸ�� TensorFlow ʵ��ģ�͡� ��ģ�� ģ��һ�ָ��ģ�ͣ��ǻ��һ��Ͽⴴ��õ�ÿ��ӳ��ֵĸ��ʣ�ͨ��һ�㽲��ǿ�һ�仰�ǲ��˵��ģ��ѧ�ϱ�ʾΪ: ��ʽ��ǣ�һ��ӳ��ֵĸ��ʵ��ڸ��ǰ��Ĵ��£��ź��Ĵʳ��ֵĸ��ʡ��ͨ��ʹ�ʽչ��õ�� Ǵ��ģ��Ҫ�Ĳ��ÿ��ʵ��Ϊ:��ǰ��Ĵ�Ԥ��һ��ʵĸ��ʡ��Щ��ʲ��һ��ӣ��Ϳ��ͨ��Ϲ�ʽ�õ�һ��ӳ��ֵĸ��ʡ��һ�仰��php��õ��ԡ��Ҳ�ȷ��ǲ��Ȼ��ԣ��Ѿ��ִ�Ϊ��php��ǡ��õġ��ԡ��ô��ֵĸ��ΪP(��php��ǡ��õġ��ԡ�)=P(��php��)P(��ǡ�|��php��)P(��õġ�|��php��ǡ�)P(��ԡ�|��php��ǡ��õġ�)��ʽϴ��ô�ж�Ϊ��һ�仰��Щ��ͨ��±�Ҷ˹��ʽ�õ�� ݴ��ʽ�ֿ��Խ��Ϊ�� Ͽ�� N ��ʣ�һ��ӳ��Ϊ T ��ô�� NT �ֿ��ܣ�ÿһ�ֿ��ܶ�Ҫ�� T ��ʲ��Ҫ�� TNT ��棬��󣬶��ڴ�Ҫ��Ҳ�Ǿ��ˡ��ô��α��أ�֮ǰ��ٵķ��в�ͨ��ô��˼·��һ��͵��Ĵ��ǽ��ʽ��½��ƣ� ��˼��˵һ��ʳ��ֵĸ��ֻ��ǰ�� n-1 ��йأ��ǰ��еĴ��йأ��ļ��ͳ�ƵĿ��ԣ��˼��Ч�ʣ��ִ��֮Ϊ n-gram ģ�ͣ�ͨ�� n ȡ2~3��ܵõ��Ч��ܽ��n-gram ģ�;��ͳ��Ͽ��дʴ��ֵĴ��һ��Լ��õ��ʴ��ĸ��ʲ��䱣��Ԥ��һ��ʱ��ֱ��ͨ��ǰ��ʹ�ʽ�õ��ӳ��ֵĸ��ʡ� ��Ҳ��ģ�ͣ��ӻ��ѧϰ�ĽǶ��һ��ʼ��ȫ��Щ�ʴ��ĸ��ֵ��ͨ��һ��ģ�ͶԴʴ��ĸ��ʽ��н�ģ��Ȼ��һ��Ŀ�꺯��Ż��Ŀ�꣬�õ�һ��Ż��Ĳ��Ҫ�ĸ��ʴ��ʱ��Ż��Ĳ��ֱ�Ӽ��õ��Ӧ�Ĵʴ��ʡ��ʴ�� P(w|context(w)) �� w �� context(w) �ĺ�� context(w) ��ʾ�� w ��ģ��൱��ǰ�� n-gram ģ�͵�ǰ n-1 ��ʣ��ô��ѧ��ʾ�� Ŀ�꺯��ö��Ȼ��ʾ��(�� NN ��Ͽ��дʵ�Ĵ�С)�� ͨ��Ż��㷨��С��Ŀ�꺯��õ�һ��Ż��Ĳ�� в�� Ϊ��Ȩֵ��ƫ�á��ô��ѧϰ��ģ��[1]ʱ��α�ʾһ��أ�ͨ��ڻ��ѧϰ��ǽ�һ��Ϊһ��Ƶأ��ģ��ǽ��(��)��ʾΪ��ͨ��word2vec��ô��ģ�;Ϳ��Ա�ʾ��ʾ��ͼ�� 㡢ͶӰ�㡢��ز��Լ��㣬��ͶӰ��ֻ�Ƕ��һ��Ԥ��дʽ��һ��Ӳ��һ��ʱ�ʾΪ m ά��ô�� n-1 ��Ӻ��Ϊ (n-1)m ά��Ӻ��Ϊ��룬��ز��ٵ��㣬�� W ��U �ֱ�ΪͶӰ�㵽��ز㡢��ز㵽��Ȩֵ��p ��q �ֱ�ΪͶӰ�㵽��ز㡢��ز㵽��ƫ�ò��ѧ��£� �� Ϊsigmoid��Ϊ��ز�ļ����Ϊ NN ά��Ӧ��Ͽ��дʵ�Ĵ�С��һ��Ҫ�پ��softmax��һ��Ϊ��ʽ��õ�Ԥ��Ͽ��ÿ��ʵĸ��ʡ��ģ�Ϳ��ƺܼ򵥣��Ǵ��ô��أ��ν�һ��ת��Ϊ��ʽ�أ��ϸ�� (word2vec) ��Ҫ��¾��ǽ��ѧ��ʾ��ǲ�� One-hot Representation ��ʾһ��ʣ��Ͽ�ʵ�� NN ��ʣ��ô��ά��Ϊ NN ��ÿ��ʱ�ţ��ڵ� i ��ʣ��ʾ��˵� i ��ԪΪ1��Ԫ��Ϊ0�� NN ά��ִ��ȱ��Զ��׼��һ��˵��Ͽ�Ĵʵ��ģ��ر��ô��ά��ͷǳ��󣬲��Ҵ��֮��û�й��ԣ��ʵ�ؿ̻��Ա��ʣ��硰��Ѷ��С��硱��ͨ��One-hot��ʾ��û��κι��Ϊ�˿˷�One-hot Representation ��ȱ�㣬Mikolov��һ�� Distributed Representation[2]��˵��⻰��ڴ�Ҷ��ݱ��CNN��ͼ��ʶ��ʱ��ȴ��о��紦��NLP��⣬��˴��NLP�ĸ�ˮƽ��ģ��Ϊ��һ��֮һ��˼�壬Distributed Representation ��ǰѴʵ��Ϣ�ֲ��ͬ�ķ��ϣ�� One-hot Representation ��Ϣ��һ��ϣ��ǽ��ӳ�䵽 m ά�ռ䣬��ʾΪ m ά��Ҳ��֮Ϊ Word Embedding��һ��Լ�С��ά�ȣ��һ��棬��Խ��й��Ĵ�ӳ��Ϊ�ռ��ڵĵ㣬��֮��Ĺ��ͨ��ռ��̻��ͼ��ʾ�� ʱ�ӳ�䵽3ά�ռ䣬ÿ��ʱ�ʾΪһ��3ά��Ĵ��ĽϽ��Կ����ϵ�Ĵʣ��֮��Ĵ��Ҳ��ࡣ Ҫ��õ��Ҫ��ģ��ѵ��õ��˵��ѵ��ģ�͹��еõ��ĸ��Ʒ��word2vec��ģ�ͣ�� CBOW �� Skip-Gram ģ��[3]��ͼ��ʾ�� CBOW ģ��Ǹ��ݴʵ��Ԥ�⵱ǰ�ʣ��ɴ�Ԥ��ʵ�ǰ�� c ��ɡ�� Skip-Gram ģ��෴��ͨ��ǰ��ȥԤ��ġ��һ��Ͽ��Ϊѵ��Ϳ��ͨ��ģ��ѵ��ÿ��ʵ��ʾ��ʵ��CBOW ģ�ͻ�ƽ��һЩ�ֲ��Ϣ��Ϊ��ʵ��Ϊ�� Skip-Gram ģ�ͽ��Ĳ��Ϊ��ѵ��õ��Ľ��Ϊ��ȷ��Ϊ�ˣ�TensorFlow �� word2vec ��õ�� Skip-Gram ģ�ͣ��Ӧ��[2]��һ�ָ�Ϊ�Ż�� Skip-Gram ģ�ͣ��ؽ��ԭ�� CBOW �� Skip-Gram ģ��ϸ�ڿ��Բ��[3]�� Skip-Gram ģ�� ǰ��Ҳ�ᵽ�� Skip-Gram ģ��Ǹ��ݵ�ǰ��ȥԤ��ģ��䣺 ��php �� õ� ��ԡ� �ٶ��ɴ�Ԥ��ʵ�ǰ��2��ɣ��ô��Ͼ��ӿ��Եõ�� (��, ��), (��, php), (��, ��õ�), (��, ��), (��õ�, ��), �� ѵ��Ŀ��Ϊ��¶��Ȼ�� c Ϊ��ĵľ��޶��ȡ�� wt ��ǰ��c ��ʽ��Ԥ�⡣c Խ��ѵ��ȷ��Ǽ��㸴�ӶȼӴ�ѵ��ɱ��ӦҲ��һ��ȡ c Ϊ2��3��ѵ��Ľ�� Skip-Gram ģ�Ͳ��softmax��Ŀ�꺯��и�� p(wi+j|wi) ��Ϊ�� vw ��ʾ�� w ��w ��ʾԤ��Ϊ w ��Ȩֵ��߶��Ǵ�ѵ��Ĳ��ѷ��֣�ͨ��Ϲ�ʽ��ÿ��ʵ��ʧ��Ҫ�õ��ʵ��е��дʣ��һ��ʵ��ǳ��ַ�ʽ�ǲ��ʵ�ʵġ��һ��(��ϡ�, ��php��)��޷��Ǹ��ݴʡ��ϡ�ȥԤ��ʡ�php��ô�Ϳ��Կ��һ��⣬��ʡ��ϡ��Ԥ�⡰php��Ϊ��Ԥ��Ϊ��ʿ��ǳ��php��дʣ�Ϊ�˼򻯼��㣬��ͨ��ķ�ʽ��ÿ��г��php��Ĵ��ȡ k ��Ϊ��ôѵ��Ŀ��ת��Ϊ��߼��ع�Ŀ�꺯�� ϱ��ʽ��֮Ϊ NCE(Noise-contrastive estimation)[4]Ŀ�꺯��еȺ��ұߵڶ��ʾͨ��һ�� Pn(w)�ֲ��Ĳ��㷨ȡ�� kk ��ʧ��[2]�в��һ��򵥵�һԪ�ֲ��˼��㣬��֮Ϊ��(Negative Sampling)��ϸ��ܸ��㷨�� 㷨 �ʵ��е�ÿ��Ͽ��г��ֵ�Ƶ��и��еͣ��˵��Щ��Ƶ�ʣ��ѡΪ��ĸ��ʽϴ󣬶��Щ��Ƶ�ʣ��ѡΪ��ĸ��ʽ�С��ʵ��ͨ��Ȩ��ʵ�֣��ÿ��ʵĴ�Ƶ��ʾΪ��λ�߶��ϵ�һС�ֶΣ��ڴʵ��СΪ NN ��Ͽ⣬��Խ��ʵ��еĴʱ�ʾΪ��λ�߶��ϵ�һ�㣬��ڵ�λ�߶��ϵȾ��뻮�� MM ��ȷ֣� M>>NM>>N �� ̾��õ�һ�� i<Mi<M��ͨ��ӳ��ҵ��Ӧ�Ĵʣ��ʾ�� [2]��ʵ�ʸ��Ƶʱ��һ��Ǽ򵥵�ͳ�ƴʵĳ��ִ��ǶԴʵĳ��ִ�� ݴ��Ƶ��ʽΪ�� Ƶ�ʶ��β�� һ��Ͽ��У��ܶೣ��Ĵʴ��֣��硰�ġ��ǡ��ȡ��Щ��Ȼ��Ƶ�ϸߣ��ṩ��Ϣȴ��١�һ��˵��Щ��Ƶ�ʵĴ��ѵ��̫��ı仯��Ϊ��ѵ��ٶȣ�ƽ��Ƶ�ʺ͸�Ƶ�ʣ��[2]��һ��Ը�Ƶ�ʶ��β��ļ��ɣ��ÿ��ʣ��¸��ʶ��ѵ�� f(wi)��ʾ��Ƶ��ʽ�в��ѷ��֣��β��Щ�� f(wi)>t ��ν�ĸ�Ƶ��Ч�� t ��Ͽ�Ĵ�С��ã�һ��Ϊ 10-5 ��ҡ� TensorFlowʵ�� ʵ��ԭ��ϴ��TensorFlowʵ��һ��׵�word2vecģ��[5]��TensorFlow�ḻ��api�Լ�ǿ��ļ��棬��ǿ��Էǳ��ر��ģ�͡��Ͽ��Ϊѵ��ݣ��ɨ��Ͽ⽨��ֵ䣬Ϊÿ��ʱ�ţ�ͬʱ��Щ��Ƶ��min_count�Ĵʹ��˵��Щİ��ɴ��һ��(��ϡ�, ��php��)��ø��õ��ɸ�ʵ��ֱ��Ϊ��ϡ��php��Լ��ɸ��logitֵ��ͨ��ع�ʽ�õ�Ŀ�꺯��(3-3)�� ͼ ��ȶ��Ҳ��Ϊ embedding matrix��Ҫͨ��ѵ��õ��Ĵ��vocabulary_size��ʾ�ʵ��С��embedding_size��ʾ��ά�ȣ��ô��Ϊ vocabulary_size �� embedding_size��þ��ȷֲ��ʼ�� embeddings = tf.Variable( tf.random_uniform([vocabulary_size, embedding_size], -1.0, 1.0)) ��Ȩֵ��ƫ��Ӧ��3-3ʽ�е� �ȣ��ʼ��Ϊ0�� weights = tf.Variable( tf.truncated_normal([vocabulary_size, embedding_size], stddev=1.0 / math.sqrt(embedding_size))) biases = tf.Variable(tf.zeros([vocabulary_size])) ��һ��batch��룬�Ӵ��ҵ��Ӧ��ʾ��Լ��Ȩֵ��ƫ��ҵ��Ӧ��ȷ��Ĳ��examples��ʣ�labelsΪ��Ӧ��ȷ��һά��ʾ��ÿ��Ԫ��Ϊ��ֵ��б�ţ� # Embeddings for examples: [batch_size, embedding_size] example_emb = tf.nn.embedding_lookup(embeddings, examples) # Weights for labels: [batch_size, embedding_size] true_w = tf.nn.embedding_lookup(weights, labels) # Biases for labels: [batch_size, 1] true_b = tf.nn.embedding_lookup(biases, labels) ��õ��ɷ��ȷ��labels_matrixΪ��ȷ��ʣ��ʱ��Щ�ʣ�num_sampledΪ��distortion��Ϊ��ʽ(3-4)�е��ָ�� labels_matrix = tf.reshape( tf.cast(labels, dtype=tf.int64), [batch_size, 1]) # Negative sampling. sampled_ids, _, _ = tf.nn.fixed_unigram_candidate_sampler( true_classes=labels_matrix, num_true=1, num_sampled=num_samples, unique=True, range_max=vocab_size, distortion=0.75, unigrams=vocab_counts.tolist()) �ҵ��Ӧ��Ȩֵ��ƫ�ò�� # Weights for sampled ids: [num_sampled, embedding_size] sampled_w = tf.nn.embedding_lookup(weights, sampled_ids) # Biases for sampled ids: [num_sampled, 1] sampled_b = tf.nn.embedding_lookup(biases, sampled_ids) �ֱ��ȷ��ͷ��ȷ��logitֵ�� WX+b��ͨ��صõ�Ŀ�꺯��(3-3)�� # True logits: [batch_size, 1] true_logits = tf.reduce_sum(tf.mul(example_emb, true_w), 1) + true_b # Sampled logits: [batch_size, num_sampled] # We replicate sampled noise lables for all examples in the batch # using the matmul. sampled_b_vec = tf.reshape(sampled_b, [num_samples]) sampled_logits = tf.matmul(example_emb, sampled_w, transpose_b=True) + sampled_b_vec # cross-entropy(logits, labels) true_xent = tf.nn.sigmoid_cross_entropy_with_logits( true_logits, tf.ones_like(true_logits)) sampled_xent = tf.nn.sigmoid_cross_entropy_with_logits( sampled_logits, tf.zeros_like(sampled_logits)) # NCE-loss is the sum of the true and noise (sampled words) # contributions, averaged over the batch. loss = (tf.reduce_sum(true_xent) + tf.reduce_sum(sampled_xent)) / batch_size ѵ��ģ�� ͼ��Ϻ��Ҫȥ�Ż�Ŀ�꺯��ݶ��½��𲽸��²��Ҫȷ��ѧϰ��ŵ��У��𲽼��ѧϰ��trained_wordsΪ��ѵ��Ĵ��words_to_trainΪ��д�ѵ��Ĵ�� lr = init_learning_rate * tf.maximum( 0.0001, 1.0 - tf.cast(trained_words, tf.float32) / words_to_train) ��Ż��ӣ�ʹ��ݶ��½�ѵ��ģ�ͣ� optimizer = tf.train.GradientDescentOptimizer(lr) train = optimizer.minimize(loss, global_step=global_step, gate_gradients=optimizer.GATE_NONE) session.run(train) ��֤�� ϲ��󣬼��ɵõ��󣬼��еı��embeddings��ô��֤�õ��Ĵ��ĺû��أ�Mikolov��˷��[2]��һ�Թ�ϵ���Ĵʣ��ڿռ��е��߽��ƽ�У��ͼ��ʾ�� Ϊ�ˣ��׼��Լ��ÿ�а��4��һ��Ԫ�� (w1,w2,w3,w4) ��һ��ϺõĴ��ÿ��Ԫ��»��¹�ϵ�� ѭ��(RNN) ��಻�Ǵ��һƬ�հ׿�ʼ˼��һƪ��µ�ʱ��ǰ��ȥ��ģ��ÿ�ο��һ��ʺ��һ��ʵ�ʱ��ִ�ͷ��ʼ��ͳ��ģ��Ǵ��㵽��ز��ٵ��㣬ÿ��֮��Ľڵ��ӵģ��ͨ��粻�߱��书�ܣ��ѭ��(Recurrent Neural Network��RNN)��⣬��߱��ԣ�ͨ��ڴ��ʱ��⣬��ڶ�NLP��У�RNNȡ��˾޴�ɹ��Լ��㷺Ӧ�á� ��RNN��У�һ��е�ǰ��뵱ǰ��й��⣬��ǰ��Ҳ�йأ��ͼΪRNN��һ��Ԫ�Ľṹʾ��ͼ��ͼƬ��Դ��[7]�� ͼ��ܻ��Ǻ��󣬸��ʱ��н��ͼƽ��չ��õ��ͼ��ʽ��ʾ�� RNN ��صģ�� RNN ��˵��Ȼ��ܹ�� Ȼ�� RNN ��һ��ȱ�㣬��Ȼ��Խ�֮ǰ��Ϣ��ӵ��ǰ��ϣ��ǰ��֮ǰ��Ϣʱ��Ⱥܴ��ݶ�˥��ԭ��RNN ѧϰ��Զ��Ϣ��½��֮Ϊ��ʱ��Long-Term Dependencies��⡣��Ԥ��һ�仰��ɻ��ϡ��һ��ʣ��ܲ��Ҫ̫��ľͿ��Ԥ�⵽��һ��Ϊ��ɡ��£��Ϣ��ҪԤ��Ĵ�֮��ʱ��Ⱥ�С��RNN ��Ժ��ѧ��֮ǰ��Ϣ��ٱ��Ԥ�⡰��Է��ὲ��һ��ʣ��ӵ�ǰ��Ϣ��һ��ʿ��һ��ԣ��Ҫ��׼ȷԤ��ԣ��Ҫ��ȥǰ��Ϣ�ˣ��ǰ�ĵġ��뵱ǰλ�õ�ʱ��Ƚϴ�RNN��ѧ��Զ��Ϣ��೤ʱ��ϸ�ڲο��[8]��˵��ǣ��һ�� RNN ��֣��ʱ��(Long Short Term Memory networks, LSTM)��Խ��⡣ ��ʱ��(LSTM) LSTM ��һ�ִ��ѡ��Լ��书�ܵ� RNN��Ч�Ľ��ʱ��⣬��ѧϰ��֮ǰ�Ĺؼ��Ϣ��ͼ��ʾΪ LSTM չ��ʾ��ͼ�� RNN , LSTM ֻ��ÿ��Ԫ�ṹ��˸Ľ�� RNN �У�ÿ��Ԫ�ṹֻ�е���� LSTM ��ÿ��Ԫ�ṹ��Ϊ��ӣ��һ��״̬�ߣ�ͼ��ˮƽ�ߣ��Լ�ס��֮ǰ��ѧ��Ϣ��(gate)��״̬��ֱ�Ϊ��š��ź��š��ŵ��ѡ��Եؽ�֮ǰ��Ҫ��Ϣ��Ա�洢��Ϣ��Ǹ��ݵ�ǰ��ѧϰ��ϢȻ��µ�ǰ״̬��ǽ�ϵ�ǰ��͵�ǰ״̬�õ�һ��Ϊ��⣬��Ϊ��һ��ʱ�̵��롣��ѧ�ķ�ʽ��ÿ��ŵ��˼�� ţ�Ҫ��Ϣ��£� ��ţ�Ҫ��ӵ��Ϣ��£� ��ô��ź��ţ�״̬��£� ��ţ��õ��Ϣ��£� LSTM ��Ԫ��붼��һ��ʱ�̵��뵱ǰʱ�̵��ͨ��concat��Ӷ��õ��룬��sigmoid��Ϊ��ŵ�ɸѡ��ֱ�õ� ft ��it ��ot��ɸѡ��ֱ�ѡ�񲿷ַ��״̬��ѡ��ǡ��ѡ��롢��ѡ�� LSTM ��ṹԭ��ϣ��ݲ�ͬ��ʵ��Ӧ�ó��ݱ��ܶ� LSTM �ı��壬�� LSTM ��ϸ��ο��[7]��һ�� LSTM ��[9]��ýṹҲ�� TensorFlow �� LSTM ��ʵ�ֵĸ��[10]�� LSTM�� ѧϰ��ص��ǰ��Ѿ�� LSTM ��ṹ�� LSTM ��ʵ��ǽ�� LSTM ��ӣ��γɶ��ز㣬��ͼ��ʾ�� ͼ��ÿ�� LSTM ��Ԫ�ڲ��ṹ��ͼ��ʾ�� l �� t ʱ��˵��hlt-1 Ϊ l �� t-1 ʱ�̣��һ��ʱ�̣��hl-1t Ϊ l-1-�㣨��һ�㣩 t ʱ�̵��Ϊ l ��t ʱ�̵��롣 ��Ľṹ��Եõ� l �� LSTM ��ѧ��, �� clt-1 ��ʾ��һʱ�̵�״̬��clt ��ʾ�ɵ�ǰ��º��״̬�� Ȼ��ʵ��֤��ģ�� LSTM ��׹��ϣ�ʵ��Ӧ��У��Ҫ��ȡ��򻯷��ϣ��г��򻯷��Dropout��[11]��[12]��һ�ּ򵥸�Ч��Dropout�� RNN/LTSM ��硣��ͼ��ʾ��Dropout��Ӧ��߷��룬��һ��Dropout�� ͼ��Dropout��ԣ��ʽ(5-5)��Ը�д��ʽ�� DD ��ʾDropout��ؽ� hl-1t ��еķ��Ϊ�㡣��ͼ��ʾ��ɫ��ʵ�߱�ʾ�� t-2 ʱ�̵��Ϣ�� t+2t+2 ʱ��Ϊ��Ԥ��Ĳο�� L+1 �ε�Dropout�� LL ��ʾ��Ĳ�� TensorFlowʵ�� ǰ�� LSTM ģ��ԭ��ʵ��֮ǰ�ᵽ��ģ�ͣ��ǰ��Ԥ��һ��ʣ��롰�ɻ��ϡ�Ԥ��һ��ʡ��ɡ��ʹ�� TensorFlow ��ʵ�� LSTM �ǳ��ķ��㣬��Ϊ TensorFlow �Ѿ��ṩ�˻�� LSTM ��Ԫ�ṹ��Operation��ʵ��ԭ��ǻ��[12]��Ĵ�Dropout�� LSTM ģ�͡��ο�ptb_word_lm.py ��LSTMģ�� TensorFlow�ṩ��Operation��ʵ�� LSTM ��ܼ򵥣��ȶ��һ�� LSTM ��Ԫ��sizeΪ LSTM ��Ԫ��ά�ȣ��ٶ��Dropout�� LSTM �Ĳ��num_layers�õ�� RNN �ṹ��Ԫ�� lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(size, forget_bias=0.0) lstm_cell = tf.nn.rnn_cell.DropoutWrapper( lstm_cell, output_keep_prob=keep_prob) lamina = tf.nn.rnn_cell.MultiRNNCell([lstm_cell] * num_layers) ÿ�θ��һ��batch��룬�� LSTM ��״̬��ʼ��Ϊ0��ʵ��ɴ��ʾ��ȶ��һ��embedding��Բ�Ҫ��һ��ʼ��û�У��ѵ��е��õ��ģ��Ϊѵ��ĸ��Ʒ��LSTM��չ��num_steps��ÿһ��һ��batch�Ĵ��Ϊ��룬�� LSTM ��Ԫ��״̬��²��õ��ͨ��softmax��һ��ʧ�� initial_state = cell.zero_state(batch_size, tf.float32) embedding = tf.get_variable("embedding", [vocab_size, size]) # input_data: [batch_size, num_steps] # targets�� [batch_size, num_steps] input_data = tf.placeholder(tf.int32, [batch_size, num_steps]) targets = tf.placeholder(tf.int32, [batch_size, num_steps]) inputs = tf.nn.embedding_lookup(embedding, input_data) outputs = [] for time_step in range(num_steps): (cell_output, state) = cell(inputs[:, time_step, :], state) outputs.append(cell_output) output = tf.reshape(tf.concat(1, outputs), [-1, size]) softmax_w = tf.get_variable("softmax_w", [size, vocab_size]) softmax_b = tf.get_variable("softmax_b", [vocab_size]) logits = tf.matmul(output, softmax_w) + softmax_b loss = tf.nn.seq2seq.sequence_loss_by_example( [logits], [tf.reshape(targets, [-1])], [tf.ones([batch_size * num_steps])]) ѵ��ģ�� 򵥲��ݶ��½��Ż��ʧ��𲽵��ֱ��õ�final_state��ΪLSTM��Ҫѧϰ�Ĳ�� optimizer = tf.train.GradientDescentOptimizer(lr) train_op = optimizer.minimize(loss) for i in range(max_epoch): _, final_state = session.run([train_op, state], {input_data: x, targets: y}) ��֤��ģ�� ģ��ѵ��Ϻ��Ѿ��õ�LSTM��״̬��룬��LSTM��󼴿ɵõ��ˡ� (cell_output, _) = cell(inputs, state) session.run(cell_output) С�� ʹ��TensorFlow��ѧϰ��ʱ��ǲ��Ҫ̫��ע��ڲ�ʵ��ϸ�ڣ�ֻ��Ѿ��ŵ�ģ�͵Ĺ��ϣ��TensorFlow�Ѿ��ṩ�ĳ��Ԫ�ṹ�Ϳ��Թ��ģ�͡�Ҳǡǡ��ΪTensorFlow�ĸ߶ȳ��󻯣��ʱ��ķѾ��ʹ��TensorFlow�Ĺ��У��Ҫ��ϸ��̫�һ��ݿ��Tensor��ɣ��Tensor�Ĳ��㣬��Ҫ��Ժ��ε��ϸ�ڵȵȣ��Ȼ�ͻ�� 43 �� : �� Ǹ��ݿ� ��ݿ��ƾ��̸ ��ݿ��ƹ�� ݿ��ܽ� ��ĵ� ��ݿ��ܵ��ż�� ݿ��ܵ�� ݿ��Ż�� ݿ�ϵͳ��ܵ��ϵ�� ؿγ� ��ݿ��Ż� �߼��ݿ�ܹ�ʦ ��ݲֿ��ھ�� Hadoopԭ��ܵ�� APP�ƹ�֮��ù��߽��ݷ�� Hadoop Hive��sql�﷨ Ӧ�ö༶��ģʽ֧�ź�� HBase ��ϸ�� HBase��ϸ�� Spark��̬��Դ�� ... ��ѵ�γ� Hadoop��Spark��ݼܹ� Hadoopԭ��߼�ʵ�� Hadoopԭ��Ӧ��Ż� ��ϵ��Ӧ�� ݵļ��ʵ�� Spark��ݴ�� γ�... �ɹ�� GE ��ʵ��ѵ ��ƹ�ĳ�ӹ�˾ Nodejs�߼�Ӧ�ÿ�� ʢ�滪 ׿Խ��߱��߱�� ĳ��Ϣ��˾ Python��ѵ ĳ��ITϵͳ�� Բ�� й��ʴ�� Գ��ģ�ͼ��(TMMI) ��Ժ ��Ʒ��Ʒ�� ... ÿ��2��ĵ�/��Ƶ ɨ��΢�Ŷ�ά�붩�� ļ��¿� ��ÿ��300��Դ �� | ��ϵ�� | ��ICP��10020922�� 110108001071��

uml.org.cn - TensorFlow??????????NLP运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

Search Preview

运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件

SEO audit: Content analysis

SEO Keywords (Single)

SEO Keywords (Two Word)

SEO Keywords (Three Word)

SEO Keywords (Four Word)

Internal links in - uml.org.cn

Uml.org.cn Spined HTML

uml.org.cn - TensorFlow??????????NLP
运用TensorFlow处理简单的NLP问题-人工智能-火龙果软件