auf der suche nach einer einfachen art, web-pages zu parsen bin ich auf die lib beautifulsoup gestossen.
erlaubt im gegensatz zu re-konstrukten eine uebersichtliche art zu parsen... hier ein kleines beispiel fuer das parsen von tabellen:
Python
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
tables = soup.find_all("table")
for table in tables:
rows = table.find_all("tr")
for row in rows:
cols = row.find_all("td")
for col in cols:
process_col()
vielleicht kann es ja mal einer gebrauchen...