数据科学与大数据技术专业导论学习总结

2022-12-12 03:29:12   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《数据科学与大数据技术专业导论学习总结》,欢迎阅读!
数据,导论,总结,科学,学习

数据科学与大数据技术专业导论学习总结

数据科学与大数据技术专业并非是计算机科学与统计学的简单拼凑,而更加突出的是数据科学本身——数据科学的基础理论、数据加工、数据分析、数据计算、数据管理及数据产品开发。学习数据科学与大数据专业,主要是培养能够在政府机构、企业、公司等从事大数据管理、研究、应用开发等方面工作的人才。

数据科学与大数据技术专业是以统计学、数学、计算机为三大支撑性学科;医学、环境科学经济学社会学、管理学为应用拓展性学科。此外还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是二专多能复合的跨界人才。其具体就业方向有大数据系统构架师(负责大数据平台搭建、系统设计 基础设施)、大数据系统分析师(其是面向实际行业领域,利用大数据技术进行数据安全生命周期管理、分析和应用)Hadoop开发工程师(其是解决大数据储存问题)、数据分析师(其是在不同行业中,专门从事行业数据搜集、整理、分析并依据数据作出行业研究、评估和预测的专业人员。在工作中通过运用工具提取、分析、呈现数据,实现数据的商业意义) 在国外,数据科学专业是以数据分析学专业为基础发展而来的,可追溯至2007年北卡罗莱纳州立大学率先设立的数据分析硕士学位。与统计学和计算机科学与技术等基础学科不同的是,数据分析学进一步抽象了这些底层科学中的数据问题,连接了包括统计学和计算机科学在内的基础学科与数据科学之间的空白,为数据科学这一新学科的出现奠定了直接基础。 在全世界的大学里,数据科学专业的人才培养具有如下几个特点:一、强调数据科学多学科交叉点,将社会科学、计算机科学、统计学、理学法学等多学科知识融入具体课程之中。二、凸显数据科学本身的讲解,注重提升学生的基于数据提出好问题的能力以及面向数据科学的研究设计、数据清理、储存与检索、交流与沟通统计分析、道德与隐私、数据可视化以及数据挖掘与探索等关键技能。三、强调动手实践能力的培养,为学生提供各大实践平台。四、强调数据科学的三要素,突出数据科学的跨学科性,开展课程涉及计算机科学统计学、机器学习及实战应用。此外还会强调机器学习在数据科学中的重要地位,重视学生对机器学习和数据可视化的掌握和应用能力。

数据科学与大数据技术专业有九种特色课程,数据科学的“理论基础”类课程有统计学类课程(主要讲解面向数据科学的应用统计学的知识,为学生深入学习数据科学理论奠定基础),机器学习类课程(主要讲解面向数据科学的应用机器学习的知识,为学生深入学习数科学理论奠定基础)Python语言课程(主要讲解面向数据科学的数据分析语言及开源工具)数据科学“基础理论”类课程(主要讲解数据课程本身的术语、理念、理论、方法、技术、工具和最佳实践应用,属于数据科学专业的入门型、导论类课程)。数据科学的“领域应用”类课程(主要讲解数据科学对某一学科领域的影响及其应用方法论或最佳实践)“数据呈现和沟通”类课程(主要讲解数据呈现于沟通能力在数据科学中的重要地位以及数科学中常用的可视化表示与故事化描述方法)“数据计算”类课程(主要讲解大数据环境下计算模式的变化及新的算法、技术、工具与平台)“数据管理”类课程(主要讲解数据管理,尤其是大数据时代的数据管理新挑战、新理念、新方法、新技术和新工具)“数据分析”类课程(主要讲解数据分析,尤其是大数据分析的方法和技术)“数据产品开发”类课程(主要讲解数据产品开发方法、实验设计和优化等知识)。数据科学中“人文”类课程(主要讲解数据科学的研究与实践中的非技术和工程类问题,主要涉及大数据与数据分析相关的道德、隐私、法律、经济和社会影响)。综合训练类课程(主要讲解如何综合运用数据科学专业中学习的理论、方法、技术和工具解决具体行业中的实际问题,重点培养学生的实战能力) 数据科学与大数据技术专业是指在培养具有大数据思维、运用大数据思维及分析应用技术的高层次大数据人才。掌握计算机理论和大数据处理技术,从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地培养学生掌握大数据应用中的各种


典型问题的解决办法,实际提升学生解决实际问题的能力,具有将领域知识与计算机技术和大数据技术融合、创新的能力,能够从事大数据研究和开发应用的高层人才。其主要课程有c语言设计、数据结构、数据库原理与应用、计算机操作系统、计算机网络、java语言程序设计、python语言程序设计、大数据算法、人工智能、应用统计、大数据机器学习、数据建模、大数据分析与处理、大数据管理、大数据实践等课程。

大数据通常用来指无法在可容忍的时间内用传统IT技术和硬软件工具对其进行感知、取、管理、处理和服务的数据集合,具有容量大、产生速度快、类型繁多、信息价值大与可获得信息多等四个特征。人类正在进入大数据时代,推动这个时代到来的科学研究活动将不可避免地受到大数据的反作用。

当然,大数据随时间流逝会快速发展。一是大数据处理系统将成为科研基础设施。在科研信息化的推动下,人类对自然和社会的观察、感知、计算、仿真、模拟、传播等活动产生出大量科学数据。二是科研方向从假说驱动转向数据探索。正如第谷的助手开普勒从第谷对天体运动运动的系统观察记录中发现了行星运动定律那样,在对所采集并仔细保存的实验数据进行挖掘和分析的基础上建立起新的理论,正是大数据时代科学活动的一个重要特征。数据技术的巨大魅力在于通过统计 算法揭示事物之间的相关性。三是科研对象的双重虚拟与观察渗透。与大数据科研方法相对应,科学研究的对象被以数据的形式二重虚拟化。在者,科学进步日益共享化与全球化。在工程化协作中所实现的科学进步,实质上也是一种共享式进步。得益于大规模计算能力、储存能力和科学仪器的共享支持,科学家们能够方便地获得和使用大量的来自其他科研团队的科学数据。大数据还使得科学进步日益呈现出全球化的效应。

在我看来,大数据在有利的同时,也有弊的存在。从积极的一方面来看,大数据或将开科学研究的“第四范式”。大数据相关的科研方法将在越来越多的领域中发挥重大的甚至是决定性作用。有了数据处理系统的辅助,科学家可以把精力集中在创造性的劳动上,大数据不会自动产生科学知识,但至少增加了科学发现的时间和可能。一批乐观的科学家更是看到了大数据对科学的变革力量。当然,依赖大数据也可能带来众多负面影响。一是科学资源垄断可能加剧。科学家能否进入大数据的研究平台,受制于海量的科研数据是否开放,也取决于是否有相应的设备来获取和处理这些数据。大数据与资本紧密结合的特性强化了科研资源掌握者对科研的走向与产出的控制。二是科学家可能形成技术路径依赖。数据技术只能对丰富而且复杂的真实世界提供相对简略的描述。更进一步而言,寻找不同寻常和意料之外的东西需要创造性和洞察力。计算机和数据库不可能自动导致创造性的科学发现,科学家如果过分依赖数据资源和搜索工具,就会造成亲身实践获取“第一手”资料的能力退化。三是科学合作的成果归属易引起纷争。最令人担心的是,随着科学和技术和商业性的开发越来越紧密,一些具有商业价值的科学信息和数据为拥有者所不愿意公开,甚至通过申请专利来实施保护,这将带来更大范围的不公平与纠纷。大数据是对人类信息处理能力的挑战,科学们来说则是,面临着科研数据爆炸式增长的威胁,如果没有应对好,科学可能无从进步。 总的来说,数据科学与大数据技术专业要想学好很难,它对于社会、生活、科学等方面都具有极大的影响力,所以我们应该正视大数据专业,认真对待每一门课程,为社会增添自己的一份力。




本文来源:https://www.dywdw.cn/c395c341f724ccbff121dd36a32d7375a517c624.html

相关推荐
推荐阅读