![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.2 动态数据采集
动态数据指采集的目标数据在JS或XHR中,在网页中有特定操作才会向服务器请求加载。
例:批量采集马刺和火箭两支球队的球员在2017年和2018年的比赛数据,以便对比两支球队的球员表现。
根据球队名称、球队名称英文缩写和年份创建球队信息表,如表5-2所示。
表5-2
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_1.jpg?sign=1738812241-DZ4M0QtWmL7Ha1C7Wb9LyFapSY9vEZmw-0-161d0e8731ed690a1ceb46cd20a178c2)
在浏览器的开发者模式下,进入NetWork(网络)界面,选择不同年份的赛季,此时NetWork窗口的左侧会新增文件链接,单击新增文件链接,在Preview窗口可查看文件内容,如图5-26所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_2.jpg?sign=1738812241-1ZguVPsb0CLFdu5hDdpVpYRA1ynxUQGT-0-8abb40377ebe5c250e9641c4dce51064)
图5-26
数据加载好后,就可以将需要采集的球队数据和年份数据作为参数导入。将表5-2中的数据输入Excel工作表,在Power BI界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,在打开的对话框中选择之前写入表5-2的Excel文件,如图5-27所示,将数据导入Power Query编辑器。
进入Power Query编辑器后,将年份的格式设置为文本,如图5-28所示,便于后续作为参数传入URL中。
创建目标URL,在“添加列”选项卡中单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/stat_box_team.php?team="&[缩写]&"&season="&[年份]&"&col=pts&order=1&isseason=1"”,并将新列名设置为“URL”,如图5-29所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_1.jpg?sign=1738812241-mP6k7yegfY7AZnnCdL5H31Z2ySalhFi7-0-1b2a63d741b4d2c0eb25416dec6979ac)
图5-27
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_2.jpg?sign=1738812241-jEttG7Mdp9QuBX4oyZ6ECECmdBuOkICy-0-078610f25a45ccb11b8c4c07e537490e)
图5-28
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_1.jpg?sign=1738812241-pDAZdeW9MEB9sLKK3bRoauLFmNyMDfcz-0-6eca86f4811f39f54f181ae6e222087e)
图5-29
创建好URL后,根据URL下载文件。在“添加列”选项卡中再次单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入=“Web.Page(Text.FromBinary (Web.Contents([URL]),65001)){0}[Data]”,如图5-30所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_2.jpg?sign=1738812241-lBwlU6rAwmdJAznvk8zortdpl3YEkREr-0-f733c5d2625517ccd3534d901d647ab6)
图5-30
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_59_1.jpg?sign=1738812241-On3RwKmekXuaprCqKljajSxN2wks0ee3-0-f940903b32a321b0254e4dfd33fdff09)
图5-31
Text.FromBinary:将二进制文件转换成文本,其语法结构为Text.FromBinary(binary as nullable binary,optional encoding as nullable number) as nullable text。本例使用该函数是为了解决乱码问题,第二个参数65001表示UTF8编码。
成功下载数据后,展开所有列,可以直接取消勾选空列,并且取消勾选“使用原始列名作为前缀”复选框,如图5-31所示。
展开数据后,取消勾选“总计”“全队数据”“对手数据”复选框,如图5-32所示。
在Power Query编辑器的“主页”选项卡中,单击“关闭并应用”按钮。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_1.jpg?sign=1738812241-MZgsOg093Jm1I6ZGlxTvkVqohV07M45t-0-e01ddd41add6a289c06048eb629347ba)
图5-32
加载好的球员数据如图5-33所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_2.jpg?sign=1738812241-b8AznrgEcePLd2rLdTaoAdqR7jIcKbbM-0-a3ff14c9f55041652c66f15e92ae320c)
图5-33