藍海億觀網2020年07月09日 866
“在eBay上銷售的賣家,應該監控eBay上的產品價格,以獲得競爭優勢。藍海億觀網了解到,定期從eBay上,獲取大規模的產品數據,是一個極具挑”
在eBay上銷售的賣家,應該監控eBay上的產品價格,以獲得競爭優勢。
藍海億觀網了解到,定期從eBay上,獲取大規模的產品數據,是一個極具挑戰性的任務。本文將展示,使用python抓取eBay上的Galaxy Note 8和iPhone 8,手機產品數據的一個例子。
如何抓取eBay產品數據
1.選擇所需的信息
網頁抓取的首要任務是,識別目標網頁,賣家需要從這個網頁中,提取所有所需的信息。
抓取eBay的產品listing,首先要在eBay上搜索產品。
在頁面加載了該產品的所有listing后,賣家需要提取該頁面的URL。
舉個例子,假設賣家提取的URL是“https://www.ebay.com/sch/i.html?_from=R40&_nkw=galaxy+note+8&_sacat=0&_pgn=1“
注意這個URL中的兩個參數,即“nkw”(new關鍵字)和“pgn”(頁碼)參數。
URL中的這些參數,定義了搜索詞(search query)。
如果將“pgn”參數更改為2,則會打開Galaxy Note 8手機產品listing的第二頁,如果將“nkw”更改為iPhone X,則eBay將搜索iPhone X,并顯示相應結果。
2.確定最后提取的標簽
完成目標網頁部分后,我們需要理解HTML布局。
在目標網頁上,右鍵選擇審查“inspect”,并打開開發人員工具窗口,或者使用鍵盤的CTRL+SHIFT+I。
在新窗口中,可以看到目標頁面的源代碼。
在本例中,所有產品都作為listing元素被提及,因此我們必須獲取所有listing。
為了獲取這些HTML元素,賣家需要一個與之相關的標識符(identifiers),可以是該元素的ID、任何類程名(class name)、特定元素的任何其他HTML屬性。
在本例,使用類程名(class name)作為標識符,所有listing都有相同的類程名,即s-item。
經過進一步的審查,可以得到產品名稱和產品價格的類名(class name),分別為“s-item__title”和“s-item__price”。
3.將收集到的數據,以結構化格式存儲
有了提取器/標識符(extractors/identifiers)之后,下一步是從HTML內容中,提取特定的部分。
完成之后,還需要將這些數據,組織成合適的結構化格式(structured format)。
創建一個表格,其中一列是所有產品名稱,另一列是它們的價格。
4.可視化結果(可選)
由于需要比較兩種不同的手機價格,賣家可以選擇可視化結果。
可視化結果不是網頁抓取的強制性步驟,而是將收集到的數據,轉化為一些可操作數據。
賣家可以繪制箱線圖(boxplots),來了解Galaxy note 8和iPhone 8手機的價格分布。
上圖中,綠線是價格數據的中位數。
對于iPhone 8來說,大部分價格在INR 25k-35k之間,而大多數Galaxy Note 8手機的價格在25k-30k之間。
iPhone 8的價格變化要比Galaxy Note 8手機大得多,iPhone 8在eBay上的最低售價是15k,而Galaxy Note 8在eBay上的最低售價是22-23k。
所需的庫和安裝(libraries and Installation)
要實現網頁抓取,賣家需要Python, Pip(用于python的安裝包程序),以及python中的BeautifulSoup library。
另外,還需要“pandas and numpy library”將收集的數據,組織成結構化的格式。
1.安裝Python和Pip
賣家可以根據這個鏈接https : / /realpython.com /installing-python /安裝Python和Pip。
2.安裝Beautiful soup library
apt-get install python-bs4 pip install beautifulsoup4
3.安裝pandas and numpy
pip install pandas pip install numpy
(跨境電商新媒體-藍海億觀網egainnews)文末掃碼加入eBay運營交流群,對接跨境電商優質資源。Coupang、Wayfair 、MercadoLibre等平臺入駐,品牌文案策劃及全網推廣、電商培訓和孵化等服務,請聯系我們。不得擅自改寫、轉載、復制、裁剪和編輯全部或部分內容。
藍海億觀網跨境賣家交流群!
跨境24H頭條資訊,關注跨境平臺最新政策推送行業最新動態。
全球跨境市場分析、電商政策及選品思維邏輯解讀。
知名跨境大賣財報分析,真實案例分析站內站外引流促單實操技巧!
掃碼入群,與同行共贏
留點想法
評論列表(0條)
藍海億觀網2022-11-04
藍海億觀網2020-02-06
藍海億觀網2020-04-30
藍海億觀網2019-12-20
藍海億觀網2021-03-19
藍海億觀網2020-09-24
藍海億觀網2020-10-16
藍海億觀網2024-11-27