Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > Java基础相关 >

语料库翻译学文库 语料库与Python应用_管新潮 PDF 下载


分享到:
时间:2023-10-20 10:40来源:http://www.java1234.com 作者:转载  侵权举报
本书以如何在语料库的教与学及其应用、语料库科研中习得Python能力的逻辑关系为线索,描述了Python的价值、意义和作用,并将内容组合成可有效助力于Python能力习得的三个层次。*层次
失效链接处理
语料库翻译学文库  语料库与Python应用_管新潮 PDF 下载 



下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版

用户下载说明:

电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
https://product.dangdang.com/25342792.html
 

相关截图:




资料简介:

本书以如何在语料库的教与学及其应用、语料库科研中习得Python能力的逻辑关系为线索,描述了Python的价值、意义和作用,并将内容组合成可有效助力于Python能力习得的三个层次。*层次是掌握与语料库相关的基础性代码;第二层次是活学活用这些基础性代码;第三层次是以创新方式运用这些代码去解决与语料库相关的较为复杂的问题。Python是语料文本处理的利器,需要在一定的理念指导下方可充分理解其在特定领域内所呈现的特征,而本书的首要目标就是帮助读者去运用这一“语言 技术”理念,其次才是Python技术本身。


资料目录:


1章  绪论

1.1  语料库与Python

1.1.1  语料库的若干维度

1.1.2  语料库的技术实现

1.2  本书概要

 

上篇  语料文本的基础性代码

2章  语料文本的读取及其运行结果的输出

2.1  概述

2.2  语料文本的读取

2.2.1  读取NLTK固有语料库

2.2.2  读取自制语料库

2.2.3  读取非独立存储的语料文本

2.2.4  读取docx格式的语料文本

2.2.5  读取xlsx格式的语料文本

2.3  语料文本运行结果的输出

2.3.1  操作界面直接输出结果

2.3.2  输出txt文件格式

2.3.3  输出xlsx文件格式

2.4  中文语料文本的读取和结果输出

2.4.1  自制语料库

2.4.2  非独立存储的语料文本

 

3章  语料库应用的基础性代码

3.1  概述

3.2  停用词的使用

3.2.1  不同语种的停用词

3.2.2  自有停用词的设置

3.3  文本降噪代码

3.3.1  具体代码的功用

3.3.2  组合使用代码的功用

3.3.3  降噪与文本计数

3.4  语料文本的语言学处理代码

3.4.1  字母大小写转换

3.4.2  词形还原

3.4.3  文本分句或分词

3.4.4  词性标注

3.5  语料库词频排序

3.5.1  简单词频排序

3.5.2  降噪处理后词频排序

3.5.3  清除停用词后排序

3.6  语料库检索与统计 

3.6.1  上下文关键词检索

3.6.2  类符形符比

3.6.3  N连词提取

3.6.4  指定词检索与统计

3.7  中文语料文本的处理方法

3.7.1  上下文关键词检索

3.7.2  中文停用词

 

4章  数据可视化

4.1  概述

4.2  表格绘制

4.3  图形绘制

4.3.1  词频图形绘制

4.3.2  柱状图和点状图绘制

4.4  词云图绘制

4.4.1  英文文本词云图

4.4.2  中文文本词云图

 

5章  代码运行错误分析

5.1  概述

5.2  错误分析案例

5.2.1  输入输出错误(IOError)

5.2.2  对象属性错误(AttributeError)

5.2.3  数据类型错误(TypeError)

5.2.4  变量名称错误(NameError)

5.2.5  索引错误(IndexError)

5.2.6  缩进错误(IndentationError)

5.2.7  参数类型错误(ValueError)

5.2.8  语法错误(SyntaxError)

5.2.9  Unicode解码错误(UnicodeDecodeError)

5.2.10  关键字错误(KeyError)

 

中篇  基础性代码的组合使用

6章  算法、代码与编程

6.1  篇章结构

6.2  算法和代码

6.2.1  算法

6.2.2  代码

6.3  选择不同代码的影响

6.3.1  分词处理方式对后续文本分析的影响

6.3.2  不同的降噪效果

6.3.3  链表、字符串、元组和字典对比

6.3.4  停用词的功用

6.4  Python与既有语料库工具的关系

 

7章  基础性代码的语料库组合应用

7.1  以Excel文件格式输出术语(类符)

7.1.1  简单输出术语

7.1.2  按词频输出术语

7.2  以Excel文件格式输出表格

7.3  语篇词汇密度的计算

7.4  语篇词汇复杂性的计算

7.5  语篇词长分布的计算

7.6  NLTK固有语料库

7.6.1  总统就职演说语料库

7.6.2  华尔街杂志语料库

7.6.3  其他相关语料库介绍

 

下篇  Python探索路径

8章  Python的语料库拓展应用

8.1  概述

8.2  单语语料导入Excel工作簿

8.3  KWIC检索功能的拓展

8.4  语篇词形还原

8.5  术语提取效果的改进

8.6  语篇段落对齐

8.7  应用语言学文献计量研究的数据提取

8.8  专业通用词的提取路径探索

 

附录1  与本书相关的加载模块与函数命令对应表 

附录2  Python2 和Python3部分代码对比 

附录3  部分NLTK固有语料库 

附录4  汉英对照术语表 

索引

 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐