第286章 快跑

离语 semaphore 1667 字 11天前

数据是指对客观事件进行记录并可以鉴别的符号Y

是对客观事物的性质状态以及相互关系等进行记

载的物理符号或这些物理符号的组合Y是可识别的

抽象的符号

�6�1数据和信息是两个不同的概念Y信息是较为宏观

的概念Y它由数据的有序排列组合而成Y传达给读

者某个概念方法等Y而数据则是构成信息的基本单

位Y离散的数据没有任何实用价值。

数据也被称为“未来的石油”

涉及到国家安全等方面。

计算机系统中的数据组织形式主要有两种Y即文件和

数据库

�0�5

1�0�6文件X计算机系统中的很多数据都是以文件形式

存在的Y比如一个WORD文件一个文本文件一个

网页文件一个图片文件等等

�0�5

2�0�6数据库X计算机系统中另一种非常重要的数据组

织形式就是数据库Y数据库已经成为计算机软件开发

的基础和核心。

过去X一旦数据的基本用途实现了Y往往就会被

删除Y一方面是由于过去的存储技术落后Y人们

需要删除旧数据来存储新数据Y另一方面则是人

们没有认识到数据的潜在价值

现在X数据的价值不会因为不断被使用而削减Y

反而会因为不断重组而产生更大的价值

将来X各类收集来的数据都应当被尽可能长时间

地保存下来Y同时也应当在一定条件下与全社会

分享Y并产生价值。

人类进入信息社会以后Y数据以自然方式增长Y其产生不以人

的意志为转移

从1986年开始到2010年的20年时间里Y全球数据的数量增长

了100倍Y今后的数据量增长速度将更快Y我们正生活在一个

数据爆炸的时代。

数据分析过程包括X数据采集与预处理数据存储与管理数据处理与

分析数据可视化等

�0�5

1�0�6数据采集与预处理X采用各种技术手段把外部各种数据源产生的数

据实时或非实时地采集预处理并加以利用

�0�5