Python是数据分析最常用的语言之一,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,实现人与计算机之间用自然语言进行有效通信的各种理论和方法。随着人机交互需求的日益增长,计算机具备处理当前主要自然语言的能力已经成为了一个必然趋势。本课程将通过案例实践操作的方式,让学员从实践中快速入门并深入了解这门语言学。
主办单位:北京市计算中心有限公司
协办单位:
北京市基因测序与功能分析工程技术研究中心
云计算关键技术与应用北京市重点实验室
工业和信息化人才培养工程培训基地
北京市大数据教学实践基地
举 办 地:北京市海淀区丰贤中路7号北科产业3号楼
课程安排:2021.10.29-30(周五--周六) 上午9:30-11:30 下午13:30-17:00
时间 | 课程内容 | 实践案例 |
第一天 上午 | 1、Python基础 2、Python中urllib和urllib2库的用法 3、Python正则表达式 4、HTTP与HTML基础介绍 5、Request库、BeautifulSoup库介绍 | (1) 影评爬取及数据分析 (2) 模拟登录淘宝并获取所有订单 (3) 爬取某学校所有新闻 (4) 百度贴吧等数据获取 |
第一天 下午 | 6、语料库的获取与词频分析 7、原始文本资料的读取与处理 8、概念图模型HMM、CRF 9、中文分词与词性标注 10、句子语法分析 | (5) NLTK工具包使用 (6) 词条频率分布图的绘制 (7) Jieba分词器的使用 (8) 使用HMM消除歧义,使用CRF进行标注 (9) 中英文词性标注 (10) 自动语法树构建系统 |
第二天 上午 | 11、卷积神经网络CNN 12、循环神经网络RNN 13、长短期记忆神经网络LSTM 14、文本分类 15、文本聚类 | (11) 基于CNN的文本分类实践 (12) RNN-LSTM实现文本情感分析 (13) 新闻类别分类 (14) 百度词条聚类分析 (15) 新闻质量智能预测 |
第二天 下午 | 16、Word2Vec模型介绍 17、CBOW与Skip-Gram模型介绍 18、Seq2seq模型介绍 19、机器翻译与语音识别技术介绍 | (16) Word2Vec影评数据分析 (17) 基于Seq2seq+Attention模型的智能对话系统 (18) 文本生成任务--歌词生成、诗歌生成 (19) IBM Watson系统的认知智慧 |
注:课程以实际发生为准;若调,会提前通知。
【报名费用】
注册费:2800元/人(含当期听课费、资料费、证书费、考试费(如有))。培训期间,食宿自理。
提供当期视频回放以供复习使用(羽林学院平台)。
开具增值税发票,提供盖章通知、结业证书等相关材料。
【报名优惠政策】
1、3人以上团体报名每人可减少300元;
2、4+1团报,可免费赠送一个名额;
3、上面优惠政策不能同时享受,只能享受其中一种;
老学员参加及推荐学员参加均可额外优惠200元。
培训以收到学员培训费为成功报名,培训座位按收到费用先后顺序安排。
【付费方式】
现金、支票、银行转账、银行汇款、现场刷卡
单位全称:北京市计算中心有限公司
账号:0200151819100023937
开户银行:中国工商银行股份有限公司北京永丰支行
(汇款信息备注:“生物计算——您的姓名”,个人汇款请备注单位名称)
注:款项支出后,请提供付款回执给工作人员,方便核实到账、开具发票。
【咨询请联系】
QQ号:3498448850
邮箱:bcc_peixun@163.com
张老师 18618295767(微信同号)
于老师 15621925881
【注】开课前一周会发送邮件通知;若未接到邮件通知,请电话咨询。