Schoene Suppe

  • auf der suche nach einer einfachen art, web-pages zu parsen bin ich auf die lib beautifulsoup gestossen.

    erlaubt im gegensatz zu re-konstrukten eine uebersichtliche art zu parsen... hier ein kleines beispiel fuer das parsen von tabellen:

    Python
            from bs4 import BeautifulSoup
    
            soup = BeautifulSoup(html, "html.parser")
            tables = soup.find_all("table")
            for table in tables:
                rows = table.find_all("tr")
                for row in rows:
                    cols = row.find_all("td")
                    for col in cols:
                        process_col()

    vielleicht kann es ja mal einer gebrauchen... ;)

  • Ich nutze für manches auch "bs4" aber das kann man jetzt nicht für mehrere Seiten gleich nutzen, muss immer angepasst werden.


    Hier mal wie ich eine Seite lese fürs Wled-Plugin:


    Bedeute aber nicht das ich dann immer "bs4" nutze, hier ist es dann mit "re" ab und zu schon einfacher.

    Aber wenn man sich mit bs4 auskennt, dann glaube ich ist das schon eine schöne Hilfe, für mich ist das auch immer testen testen testen. :)