[Numpy-discussion] Importing data from html tables

ale nardei@infinito...
Fri Sep 7 05:11:10 CDT 2007


Hi,
I'm trying to import into array the data contained in a html table.
I use BeautifulSoup as html parser

html = open('T0015.html','r')
bs = BeautifulSoup(html)
for tr in bs.findAll('tr')[1:]:
        table.append([td.p.string for td in tr.findAll('td')])

and I get this:

print table

[[u'1925', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'105.0']
[u'1926', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'136.0']
[u'1927', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'--', u'51.0']
[u'1928', u'--', u'--', u'--', u'nn', u'--', u'--', u'--', u'--', u'104.0']
,.......and so on]

How to put this list of list of strings in a numpy array, and set '--'
and 'nn' as NaN?

Thank you
Alessio



More information about the Numpy-discussion mailing list