Excel数据分析1 导入+清洗

墨柠C / 2023-08-20 / 原文

数据分析流程

导入——清洗(70%时间)——处理——展现

导入数据避坑指南

1.表格导入:谨慎选择导入格式

2.非表格导入:多技巧综合灵活运用

快速复制方法,点击起始点,(拖动页面滚轮条),shift点击结束点,即可选中中间区域

 清洗此数据

首先倒退思维

一套房源应该在EXCEL中为一行,那么我们需要将txt中多行数据变为一行

所以需要引入新的载体,WORD

 复制到word中,如图所示,有多个换行符号

在替换中

 特殊格式,段落标记就是换行符

 

选择替换为三个竖线,因为三竖线出现概率小

这时候全部变为一行,那需要再改成每一套分成一行,再看源数据哪里的区别

 因为每个不同房源结尾都是/平,所以我们根据这个换行

 

这时候再复制到excel中,就是每行开始的了,每行都是三竖线开始,开头没有 补齐开头

选择分列,用分隔符号|,选择连续分隔符号(这样三个视为一个)

接下来的数据进行进一步分列

如低楼层(共26层)1室1厅    用(,)分列

如果只想替换某一范围内的数据,就选中范围

描述内容中,-杭州替换成|||再分列

如临安临安,那就用字段宽度分列,可以用分列线拖动分列

导入数据技巧总结

1.长短复制技巧:shift

2.分列技巧:固定宽度/分隔符号

3.替换技巧:信息末尾特定文本 ^p分段符,|||替换;灵活替换