![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.1 静态数据采集
静态数据是指采集的目标数据在网页源码中,而且是一次性加载在网页中的。
例:采集某电商平台商品页面数据。
在亚马逊网站,搜索“连衣裙”,如图5-1所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_43_1.jpg?sign=1738813751-qei61xOGLgZdi0RlCjmpyjExE6xGKPIJ-0-0cc9904d37f7e0eef0980599f59bd3c4)
图5-1
打开Power BI,单击“主页”选项卡中的“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项,如图5-2所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_1.jpg?sign=1738813751-320Ank62c4F6jI6dVzmMryT7vqsbdyR2-0-d6e41d94c89ffb9bb03085589bbf53ed)
图5-2
弹出“从Web”对话框,将网页链接复制到URL文本框,然后单击“确定”按钮,如图5-3所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_2.jpg?sign=1738813751-yjgR2LOvtNcjUBYrhHEpGKwIBRcYfCYz-0-3cadf9d4d801cc0f87f32c84d567da08)
图5-3
单击“Web视图”选项卡,再单击“使用示例添加表”按钮,如图5-4所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_1.jpg?sign=1738813751-SysJpUpPMaRckyCzBn7TeiRTOGHcqMVy-0-03d6cf5f7639fdcdfc1aa12df2304991)
图5-4
打开“使用示例添加表”对话框,在“列1”的第1行,输入价格“268.79”,选择弹出的第一个参数,如图5-5所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_2.jpg?sign=1738813751-oFNlDwhIOoAyXiDk0eDXEKVomO0ub9yU-0-f7fd751edbbb839f2af4018f367494cb)
图5-5
按Enter键后,效果如图5-6所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_1.jpg?sign=1738813751-EpVd911I2okjGMHxD5JgpbWopgpDUzzS-0-669faf47f9f73e78a384f2ecc16efb10)
图5-6
获取商品的其他数据也使用同样的操作,结果如图5-7所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_2.jpg?sign=1738813751-RYBAzmyzFo2fYc6vc9XnxMRBvTfYOG6U-0-158a564f8602493abec5ffa994417103)
图5-7
商品数据在“表视图”选项卡的“自定义表[1]”的“表7”中,如图5-8所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_1.jpg?sign=1738813751-KnCcpdSVzn9C8FVXvKJO9xytTZDETw0s-0-f6c04faeab06020d40b207e14c4f0081)
图5-8
例:采集休斯敦火箭队球员最新赛季的数据,球员比赛数据如图5-9所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_2.jpg?sign=1738813751-lpKV4bkM3BQ2TKE7P1EQ4ypoP9n95OUS-0-c7d467e89b1c3ec713b5e486208c9df2)
图5-9
在Power BI的“主页”选项卡中,单击“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项获取网站的数据。
弹出“从Web”对话框,在URL文本框中输入网址,然后单击“确定”按钮,如图5-10所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_1.jpg?sign=1738813751-UJHun9OVYuCtSiDhkdHht7uo2S8IwZSB-0-0ea87f821d5da6a1320d8e0097b25766)
图5-10
在打开的“导航器”对话框中通过“表视图”选项卡可以看到“表1”是目标数据。勾选“导航器”对话框左侧列表中的“表1”,如图5-11所示,再单击“转换数据”按钮进入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_2.jpg?sign=1738813751-GvSFsvDB31Yfu2fie32vmnWq0tsrcJ64-0-5b285f44458131097b002d76fa47d09b)
图5-11
进入Power Query编辑器后,发现有一列空列,在该列名上右击,在弹出的快捷菜单中选择“删除”选项,如图5-12所示,将空列删除。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_1.jpg?sign=1738813751-TT3fzIdGBCDc50GL9a01jhF3WA72F2Js-0-cd4aff6d23f04a76726023148483cabc)
图5-12
在“主页”选项卡中单击“将第一行用作标题”按钮,如图5-13所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_2.jpg?sign=1738813751-zmgInUd7JL97K15Jh3RZcYhNozmFPo4N-0-0b62c1d97158ac73eb86ba72e54d4f67)
图5-13
筛选球员数据,取消勾选“总计”“全队数据”“对手数据”选项前的复选框,如图5-14所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_3.jpg?sign=1738813751-3PBJvUd1FPfx9ODG10JAzxS8M6wg2S16-0-cde288e8b3b6ef44d7a353c946ca7f79)
图5-14
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮,如图5-15所示,将数据导入BI中。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_1.jpg?sign=1738813751-QjGb17c1tunLq8MRsPCBzbr3tvUgq2iN-0-9bd009f2865e6a85d0ed058e27c34d46)
图5-15
加载后,表格中的数据如图5-16所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_2.jpg?sign=1738813751-SwUcRVEIyrKCJPVk8bxIE8KWlWtz8ArK-0-88d5f9c8d663954d8cc912c8551a46f2)
图5-16
例:批量采集球队最新赛季的数据,球队名称及英文缩写如表5-1所示。
表5-1
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_1.jpg?sign=1738813751-PjHWyc8OMWT1YnJgjMO14fXQtra0uiWt-0-a42433733de078308fa16cd652667755)
将数据输入Excel工作表之后,在Power BI Desktop界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,如图5-17所示,将数据导入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_2.jpg?sign=1738813751-3zBr8dQN4oIr1g80Zhv2aIvEAbLY2SYk-0-350c60c6c3783c767418a49e355160f5)
图5-17
将数据导入Power Query编辑器后,创建URL,在“添加列”选项卡中单击“自定义列”按钮,如图5-18所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_1.jpg?sign=1738813751-w2KT8qkMYxDMEP7NPitZW5W9jPo56rNp-0-8193f936fd530e27f1a611c71e18662b)
图5-18
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_2.jpg?sign=1738813751-cJ5GnhCbhaWaJjbRBMrvXe75pb4uRbrx-0-a908dca49956bedcaaa244cf9ed7246a)
图5-19
在打开的“自定义列”对话框的“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/"&[缩写]&".html"”,然后单击“确定”按钮,如图5-19所示。
创建好URL后再次添加自定义列(在“添加列”选项卡中单击“自定义列”按钮),采集URL数据。
在弹出的“自定义列”对话框的“自定义列公式”文本框中输入“=Web.Page(Web.Contents ([URL])){0}[Data]”,如图5-20所示。
M函数说明
Web.Page:以网页的方式加载数据。
Web.Contents:将网页以二进制文件的格式下载。
{0}[Data]:打开网页中的第一张表格,也就是打开本例的“Table 0”。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_1.jpg?sign=1738813751-n8wRxZ9yJwk9wdhdh4ec8HZ28LF4Mwbc-0-2556fd96a485521930557bd7fbb1c90c)
图5-20
单击“确定”按钮后,如果是首次连接该域名,则会提示用户进行数据隐私设置,选择“忽略此文件的隐私级别检查,忽略隐私级别可能会向未经授权的用户公开敏感数据或机密数据”复选框,如图5-21所示。单击“保存”按钮即可采集数据。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_2.jpg?sign=1738813751-frJxCkjvPcTrCyac5EyiTrLqNMWdMMyl-0-f34d20493d8a673160667ab05fd97c1b)
图5-21
展开所有列,空列可以直接取消勾选,并且取消勾选“使用原始列名作为前缀”复选框,如图5-22所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_1.jpg?sign=1738813751-NtTcbvkajqb0upSl0dgYnaUYH4WBWdhe-0-d4e0d6356d0db39074cce91ae62cb11b)
图5-22
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_2.jpg?sign=1738813751-SJWkG0fBdTJQoEEHAtDSOVQuCh9uAiWW-0-64c49d3d70a45837ad68b3516fef6443)
图5-23
展开球员数据后,分别取消勾选“总计”“全队数据”“对手数据”复选框,如图5-23所示。
按住“Ctrl”键,将不需要的列选中并右击,在弹出的快捷菜单中选择“删除”选项,如图5-24所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_1.jpg?sign=1738813751-xMT0XpaYtnaOt1Y1Ogf9kII2UcxuKWyM-0-54fe90fb9e8f01a29ce9e20a551d3c7e)
图5-24
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮。
加载好的数据如图5-25所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_2.jpg?sign=1738813751-fagvb72QfxUAjnOZ8GhQ1d2DkaDNyuky-0-c8658f9480d47c74e325d0d48f6ae009)
图5-25