![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.1 静态数据采集
静态数据是指采集的目标数据在网页源码中,而且是一次性加载在网页中的。
例:采集某电商平台商品页面数据。
在亚马逊网站,搜索“连衣裙”,如图5-1所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_43_1.jpg?sign=1739526940-D3MBjbGI5yU1H6KjUENEbkHGolNMuhz1-0-225f833c15f797ffc8f9cc1f782409bd)
图5-1
打开Power BI,单击“主页”选项卡中的“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项,如图5-2所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_1.jpg?sign=1739526940-rSGUtT0cXFD3uhXsxg15Xy7LY6PnCB1m-0-fe24e42f98faef829f7d950c17c52eb2)
图5-2
弹出“从Web”对话框,将网页链接复制到URL文本框,然后单击“确定”按钮,如图5-3所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_2.jpg?sign=1739526940-P2OpcsPyzHVNBhFXJ8gHmtO4hCIF8IeX-0-9cd355be8cbd784527c429655f970ca7)
图5-3
单击“Web视图”选项卡,再单击“使用示例添加表”按钮,如图5-4所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_1.jpg?sign=1739526940-wMQz3YwFX5fEsz6QKb7ak82P1TYjing5-0-c06aa51d670dee2feecdc54204b03d70)
图5-4
打开“使用示例添加表”对话框,在“列1”的第1行,输入价格“268.79”,选择弹出的第一个参数,如图5-5所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_2.jpg?sign=1739526940-0mO6FSp3xTNor7IvGdlC58NTP91vzrv7-0-c92b742055e6dbce7343ced88506231d)
图5-5
按Enter键后,效果如图5-6所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_1.jpg?sign=1739526940-eJbzu3KiPhGZvDzxzMxXYQCdTdyg7Mvh-0-ce34a8568d795641410b7fa875c8c628)
图5-6
获取商品的其他数据也使用同样的操作,结果如图5-7所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_2.jpg?sign=1739526940-XHNc8FOhkUtB0i3UXcnq5fjNpct3UwEm-0-a6f679960d768ea7cb3a90b7e327da1b)
图5-7
商品数据在“表视图”选项卡的“自定义表[1]”的“表7”中,如图5-8所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_1.jpg?sign=1739526940-HV1mKK0GlQD0kvKnwOGF6tpjYDiiCiPp-0-ef2dcc7905c0cfcae0283de28f1f5285)
图5-8
例:采集休斯敦火箭队球员最新赛季的数据,球员比赛数据如图5-9所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_2.jpg?sign=1739526940-6Ye9eGarsPowYUZPJnjaxzuPedFGMfXb-0-0ee85862abb6c61da50ef82207192abc)
图5-9
在Power BI的“主页”选项卡中,单击“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项获取网站的数据。
弹出“从Web”对话框,在URL文本框中输入网址,然后单击“确定”按钮,如图5-10所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_1.jpg?sign=1739526940-IyKHub6WrC6Er5d8TFIVGSgi22lM8bgq-0-41d4246a70b1acec379128a0e28e5fe7)
图5-10
在打开的“导航器”对话框中通过“表视图”选项卡可以看到“表1”是目标数据。勾选“导航器”对话框左侧列表中的“表1”,如图5-11所示,再单击“转换数据”按钮进入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_2.jpg?sign=1739526940-8Lwrreakqppg8EH8cVfQtHLgVEuGyRYg-0-6fbc7c69612d761eccf4025683df49a8)
图5-11
进入Power Query编辑器后,发现有一列空列,在该列名上右击,在弹出的快捷菜单中选择“删除”选项,如图5-12所示,将空列删除。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_1.jpg?sign=1739526940-7DEUXg3OKZyuPbJJEZssB1GTWFOv6UQ9-0-3b72b458a62f68e9efaea8b5fd34248d)
图5-12
在“主页”选项卡中单击“将第一行用作标题”按钮,如图5-13所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_2.jpg?sign=1739526940-pQdQfvfJ8Dyd7xBYm5DcmxWqnMTUrRly-0-ec7cdbd436414cf6a1f26b662f431944)
图5-13
筛选球员数据,取消勾选“总计”“全队数据”“对手数据”选项前的复选框,如图5-14所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_3.jpg?sign=1739526940-uKwIm1f8ZJqMVOrhLEGTKrlBQeQMR3JH-0-abf7e9655609a703686a54771f8ae028)
图5-14
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮,如图5-15所示,将数据导入BI中。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_1.jpg?sign=1739526940-PmfS1jYFpoFg3Mo9wiaafBbnZWZ1KMkL-0-3d9a664772f0e02ccf5603f30317f655)
图5-15
加载后,表格中的数据如图5-16所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_2.jpg?sign=1739526940-kIiR7mcGRxqJVi2i78MIO0jBtfSpnj2L-0-cbe37e4246e96eab8d3d7764e61609cf)
图5-16
例:批量采集球队最新赛季的数据,球队名称及英文缩写如表5-1所示。
表5-1
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_1.jpg?sign=1739526940-GCahZSNLWj6WmaBjMCElnWKmyT3llaQY-0-736fbe2ec00890461717d146bd714be6)
将数据输入Excel工作表之后,在Power BI Desktop界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,如图5-17所示,将数据导入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_2.jpg?sign=1739526940-E0mxOtlzoJ54saTf0DeOdqUsQaJyux4w-0-2c3cd2c9d26337d88c3d703ea82b37e1)
图5-17
将数据导入Power Query编辑器后,创建URL,在“添加列”选项卡中单击“自定义列”按钮,如图5-18所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_1.jpg?sign=1739526940-cFDLWpPW7SUeihjz1U4FcEOB0MaJvRRX-0-077eed62b9d5b6e77e706b31312d453d)
图5-18
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_2.jpg?sign=1739526940-JbsutzEIiREjHHyO7ZvF6VxoVOM3APk5-0-aec5aa591a1126c9d87d93cf9050f08d)
图5-19
在打开的“自定义列”对话框的“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/"&[缩写]&".html"”,然后单击“确定”按钮,如图5-19所示。
创建好URL后再次添加自定义列(在“添加列”选项卡中单击“自定义列”按钮),采集URL数据。
在弹出的“自定义列”对话框的“自定义列公式”文本框中输入“=Web.Page(Web.Contents ([URL])){0}[Data]”,如图5-20所示。
M函数说明
Web.Page:以网页的方式加载数据。
Web.Contents:将网页以二进制文件的格式下载。
{0}[Data]:打开网页中的第一张表格,也就是打开本例的“Table 0”。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_1.jpg?sign=1739526940-Y4RDQxAg4v7GTQ1xjtrWV94fo6UoWXjr-0-395cc31caac2dc7acd37e2fca145f6c7)
图5-20
单击“确定”按钮后,如果是首次连接该域名,则会提示用户进行数据隐私设置,选择“忽略此文件的隐私级别检查,忽略隐私级别可能会向未经授权的用户公开敏感数据或机密数据”复选框,如图5-21所示。单击“保存”按钮即可采集数据。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_2.jpg?sign=1739526940-XMFnv4XTtfTFv5ootBkwUObA9ApIMzW5-0-be72787b451fbbde54612e49d17812eb)
图5-21
展开所有列,空列可以直接取消勾选,并且取消勾选“使用原始列名作为前缀”复选框,如图5-22所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_1.jpg?sign=1739526940-aJkkvY1GPPdEmp7CkJ9JfnGe4wVhQomI-0-bb59f09ba1ff0bef0f0642b93215df44)
图5-22
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_2.jpg?sign=1739526940-C65oXHl3VpKfgbLpG1Ny3gvihs8ipfIq-0-688dcf1d87f0564a29f10f85eccb6ef9)
图5-23
展开球员数据后,分别取消勾选“总计”“全队数据”“对手数据”复选框,如图5-23所示。
按住“Ctrl”键,将不需要的列选中并右击,在弹出的快捷菜单中选择“删除”选项,如图5-24所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_1.jpg?sign=1739526940-You9fONqtMqh7CeysaOS5vpv96rLCVOR-0-906d1455b1e3cd6139f54b8f0fd9c820)
图5-24
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮。
加载好的数据如图5-25所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_2.jpg?sign=1739526940-VagdbIGq2xS08pStoKTZYmrj2vUNyhh8-0-529f452840f0d87a336d3338cd65a834)
图5-25