【问题标题】:Need help storing list as table and iterating scraping through pages需要帮助将列表存储为表格并通过页面迭代抓取
【发布时间】:2021-03-05 16:54:55
【问题描述】:

所以我设法抓取了这个电子商务网站,并且我有产品名称和产品价格的 for 循环。我的第一个问题是如何将两者结合在一个表中。其次是如何在网站的不同页面或多个 url 中迭代这些。为这个愚蠢的问题道歉,但我刚刚开始使用 python,因为我想将它用作与我更擅长的 R 相比更优秀的抓取工具。感谢任何回复。

import selenium
driver.get("https://shopee.ph/shop/301669184/search?page=5&sortBy=pop")
productname = driver.find_elements_by_class_name("_2wYmLR")
for i in productname:
   x = print(i.text)
productprice = driver.find_elements_by_class_name("_1xk7ak")
for l in productprice:
    df2 = print (l.text)

【问题讨论】:

    标签: python selenium web-scraping


    【解决方案1】:

    您只需执行以下操作即可将值放入数组中。

    x=[i.text for i in productname]
    df2=[l.text for l in productprice]
    

    然后你可以像这样将它们放入数据帧中

    df = pd.DataFrame({'name':x,'price':df2})
    print(df)
    

    导入

    import pandas as pd
    

    输出

                                                     name price
    0    Crown Kids Boys Round Neck Tshirt in Apple Green    89
    1     Crown Kids Boys Round Neck Tshirt in Fern Green    89
    2     Crown Kids Girls Round Neck Tshirt in Turquoise    89
    3    Crown Kids Girls Round Neck Tshirt in Royal Blue    89
    4     Crown Kids Girls Round Neck Tshirt in Navy Blue    89
    5    Crown Kids Girls Round Neck Tshirt in Light Gray    89
    6   Crown Kids Boys Round Neck Tshirt in Carnation...    89
    7      Crown Kids Boys Round Neck Tshirt in Tangerine    89
    8          Crown Kids Boys Round Neck Tshirt in Cream    89
    9        Crown Kids Boys Round Neck Tshirt in Muroise    89
    10  Crown Kids Girls Round Neck Tshirt in Emerald ...    89
    11   Crown Kids Girls Round Neck Tshirt in Light Blue    89
    12         Crown Kids Boys Round Neck Tshirt in Peach    89
    13  Crown Kids Boys Round Neck Dark Color Tshirt C...    89
    14  Crown Kids Boys Round Neck Light Color Tshirt ...    89
    15        Crown Kids Boys Round Neck Tshirt in Violet    89
    

    【讨论】:

    • 你是天赐之物。太感谢了!标记为答案
    • 也许只是后续行动。有什么方法可以将此代码重申到 url 的多个页面?例如search?page=1、search?page=2 等
    猜你喜欢
    • 1970-01-01
    • 2021-05-21
    • 2013-02-28
    • 1970-01-01
    • 1970-01-01
    • 2017-09-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多