网络安全之应用数据科学和机器学习
网络安全之应用数据科学和机器学习
培训讲师
Mr. Charles Givre 最近加入了 Deutsche 银行,担任担任首席信息安全办公室的首席数据科学家. 在加入 Deutsche 银行之前, Mr. Givre 一直担任博思艾伦咨询公司的首席高级数据科学家,从事网络安全和数据科学工作。 在博思艾伦咨询公司, Mr. Givre 参与了博思艾伦最大的分析项目之一,在该项目中,他领导了数据科学工作,并致力于扩展数据科学在该计划中的作用。
Austin Taylor (www.austintaylor.io) 具有广泛的进攻和防御网络操作背景,并且为一些世界顶级的财富公司做过安全响应,他的专长包括渗透测试,数据科学,威胁搜寻以及用户和实体行为分析(UEBA). 他教授数据科学课程已经有三年了,并且还是《How to Build a World Class Monitoring System for Home, Small Office, or Enterprise Networks》一书的作者. 在他的闲暇时间, 他教授编程并在会议上进行培训。目前担任美国空军的网络战操作员,IronNet网络安全的首席安全研究工程师.拥有多项行业认证,包括CISSP,GMON,GCCC,GXPN,GCIA,GCIH,GCPM,GSEC,GPEN,CEH,VCP, CCNA:Security
概况
该交互式课程将教授安全专业人员如何使用数据科学技术快速操作,分析网络和安全数据,并最终从这些数据中发现有价值的东西。 该课程将涵盖整个数据科学过程,包括数据准备,特征工程和选择、探索性数据分析,数据可视化,机器学习,模型评估和优化,最终大规模实施——都将关注安全相关的问题。
参与者将学习如何以各种常见格式读取数据,然后编写脚本来分析并可视化数据。
培训对象
希望在工作中运用自动化数据分析、机器学习和数据科学的任何学员。
关键学习目标
• 编写脚本以高效读取和操作 CSV、XML 和 JSON 文件;
• 快速有效地解析可执行文件、日志文件、pcap 文件并从中提取* 伪像 (artifact);
• 调用 API 以合并数据集;
• 使用 Pandas 库快速操作表格数据;
• 使用 Python 有效实现数据可视化;
• 预处理原始数据,以用于机器学习和特征工程;
• 建立、应用和评估机器学习算法,以识别潜在威胁;
• 自动调整和优化机器学习模型;
• 查找不规则的威胁指标并降低误报;
• 使用随机森林算法、朴素贝叶斯算法、K 近邻(K-NN)算法和支持向量机(SVM)算法等监督学习算法对恶意 URL 进行分类并发现 SQL 注入;
• 应用K-Means 聚类算法等无监督学习算法检测异常行为。
预备知识
学生需了解 Python 编程语言。
硬件/软件要求
• 学员需自带笔记本电脑:
o 电脑上安装了 Virtualbox(或 VMWare),内存 6GB,磁盘存储空间 10GB;
o 安装 Anaconda 工具和 Ipython 系统
• 强烈建议使用我们提供的虚拟机,因为该虚拟机可以提供最佳学习体验。
将会向学员提供什么?
预先配置好的、含有授课所需全部软件的虚拟机(VM)。VM 中包含:
• 课程的所有课件、笔记、参考资料、讲义和文档;
• 用于课堂练习的框架代码实例。
学员还可以在我们的网站上做其他练习题。