科学始终是不公道的。如果它不提出十个问题,也就永远不能解决一个问题。
数据处理就是根据数据分析的目的,将采集到的数据用适当的处理方法整理和加工,形成适合数据分析要求的样式,也就是一维表。它是数据分析前必不可少的阶段。数据处理包括数据合并、数据计算、数据分组、数据去重等操作。先来学习数据合并,数据合并包括横向合并和众向合并。
横向合并
横向合并就是从多个表中,根据各表共有的关键字段,把各表所需的记录一一对应起来。在Access中完成数据横向操作的步骤如下:
1、数据库工具——关系——添加表关系;
2、在【关系管理器】中,用鼠标拖动关系表中相同的两字段,建立联系;
3、在弹出的【编辑关系】对话框中,单击【连接类型】,选中“只包含两个表中联接字段相等的行”,确定返回并创建;
4、单击【创建】选项卡,在【查询组】中单击【查询向导】,在弹出的【新建查询】对话框中,默认选择【简单查询向导】;
5、在弹出的【简单查询向导】对话框中,将需要查询的字段移至【选定字段】中,点击完成后,即可完成相关查询;
上述操作如果写成SQL语句如下:
SELECT 订购明细.用户ID, 订购明细.产品, 用户明细.性别
FROM 订购明细 INNER JOIN 用户明细 ON 订购明细.[用户ID] = 用户明细.[用户ID];
在关系型数据库中,数据库存在连接关系:内连接(INNER JOIN)、左链接(LEFT JOIN)、右连接(RIGHT JOIN)。
内连接:选择两个表中关键字段相匹配的记录;
左连接:选择第一个表中的所有记录以及第二个表中与关键字相匹配的记录;
右连接:选择第二个表中的所有记录以及第一个表中与关键字相匹配的记录;
数据库连接关系
纵向合并
数据的纵向合并,也就是数据记录的合并。合并的表必须:具有相同的字段,它们字段的数目必须相同,并且字段的数据类型也必须相同。
将一个表中的数据追加到另一个表中,Access的操作步骤如下:
1、单击【创建】选项卡,在【查询】组中单击【查询设计】按钮;
2、在弹出的【显示表】中,将需要合并的对象添加到【设计视图】中;
3、单击【设计】选项卡中的【追加】,选择需要追加的目标表;
4、返回查询视图,选择所有字段并一一对应目标表字段,单击【设计】选项卡的【运行】,即可完成数据的纵向合并操作。
上述操作如果写成SQL语句如下:
INSERT INTO 订购明细20110902 ( 订单编号, 订购日期, 产品, [单价(元)], 数量, 订购金额, 用户ID )
SELECT 订购明细20110901.订单编号, 订购明细20110901.订购日期, 订购明细20110901.产品, 订购明细20110901.[单价(元)], 订购明细20110901.数量, 订购明细20110901.订购金额, 订购明细20110901.用户ID
FROM 订购明细20110901;
如果要完成两表或多表数据的纵向合并,可采用以下格式的SQL语句:
INSERT INTO 订购明细201109 ( 订单编号, 订购日期, 产品, [单价(元)], 数量, 订购金额, 用户ID )
FROM
(SELECT A.订单编号, A.订购日期, A.产品, A.[单价(元)], A.数量, A.订购金额, A.用户ID FROM 订购明细20110901 AS A
UNION ALL
SELECT B.订单编号, B.订购日期, B.产品, B.[单价(元)], B.数量, B.订购金额, B.用户ID FROM 订购明细20110902 AS B)
合并多表中往往会用到UNION ALL 或 UNION指令。UNION ALL是将各表的记录合并到一起,并且对这些记录不做任何更改;而UNION会删除各表存在的重复记录,并对记录进行自动排序,因此UNION需要更多的计算资源。以下情况尽可能使用UNION ALL:
知道有重复记录且想保留这些记录;
知道不可能存在任何的重复记录;
不在乎是否存在任何的重复记录。
科学要求一切人不是别有用心而心甘情愿地献出一切,以便领受冷静的知识的沉甸甸的十字勋章这个奖赏。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有