社群經營必備!好奇自己FB的互動性指標嗎?!用Selenium爬抓取FB文章內容及留言時間(附Python程式碼)

為何「文章內容」及「文章時間」很重要呢?

接著就讓我們一同來看看如何操作吧!

文章內容抓取

教育部粉絲團網頁元素
▲ 圖一、查看網頁元素(來源:教育部粉絲團)
# 將網頁元素放入Beautifulsoup
soup = Soup(driver.page_source,”html.parser”)
教育部粉絲團網頁元素
▲ 圖二、文章內網頁元素(來源:教育部粉絲團)
<div class="ecm0bbzt hv4rvrfc ihqw7lf3 dati1w0a">
# 抓取文章內所有文字
soup.find(class_ =’ecm0bbzt hv4rvrfc ihqw7lf3 dati1w0a’).text
教育部粉絲團文章文字
▲圖三、執行結果-文章內所有文字(來源:教育部粉絲團)

文章時間抓取

  1. 查看網頁內元素
  2. 找到文章時間的class name
  3. 如果無 class name 或有許多相同的class name 可用屬性定位
教育部粉絲團文章元素
教育部粉絲團文章時間元素
▲ 圖四、文章時間元素(來源:教育部粉絲團)
教育部粉絲團文章時間元素
▲ 圖五、文章時間定位元素(來源:教育部粉絲團)
<a aria-label ="2天" class="oajrlxb2 g5ia77u1 qu0x051f esr5mh6w e9989ue4 r7d6kgcz rq0escxv nhd2j8a9 nc684nl6 p7hjln8o kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x jb3vyjys rz4wbd8a qt6c0cv9 a8nywdso i1ao9s8h esuyzwwr f1sip0of lzcic4wl gmql0nx0 gpro0wi8 b1v8xokw" href="https://www.facebook.com/www.edu.tw/posts/1647437415430873?__cft__[0]=AZUjZWq8K6YJOhn8500VIHK_-YgS7roPcEmQxfrPrG-rcOB_xlWOKXyOpcOtyHPElmF6MoY8C87XgMPrkw4t8ckixRUrXVTXx-YXFaG1kK1Aik0Vc6azVenLpaNHv10VfdAsTf9ZCdjLIaUreU5PpIa0NlfDnigbz9quVQIqoKtaWQ&__tn__=%2CO%2CP-R" role="link" tabindex="0">
教育部粉絲團時間抓取
▲ 圖六、時間抓取
教育部粉絲團時間抓取
▲ 圖七 、去除等號

如果這篇文章對您有幫助,就太棒了 ! !

趕快追蹤我們,別錯過後續更多相關的精彩內容~

更多實戰案例及情境好文推薦

回到頂端