title image


Smiley HTML-Dokument nach DOM konvertieren, um XPath Ausdrücke anzuwenden
Hallo, ich möchte aus einer html-Seite Daten extrahieren. Ich bräuchte mal ein paar Tips wie ich den HTML-Code in einem DOM-strukturiertem Dokument speichern kann und dann z.b.mittels XPathNavigator auf einzelne Knoten im Dokument zugreifen kann.



ich habe schon folgendes versucht:



HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://magiccards.info/sok/de/39");



HttpWebResponse response = (HttpWebResponse) request.GetResponse();

Stream s = response.GetResponseStream();

try

{

XPathDocument xdoc = new XPathDocument(s);

}

catch(WebException wex)

{

MessageBox.Show(wex.Message);

}



Die URL stimmt, ich bekomme auch den kompletten http-code, wenn ich mit einem Reader den Stream zeilenweise bis zum Ende auslese. Nur bei diesem Code-Fragment bekomme ich immer die Fehlermeldung "404" vom Server, sobald ich das XPathDokument erstellen will. Ich denke mir, das es eigentlich funktionieren müßte, da das html-Dokument auch xhtml-konform ist, laut DOCTYPE.



Hat jemand eine Idee, warum es nicht funktioniert?



Danke, Micha

geschrieben von

Login

E-Mail:
  

Passwort:
  

Beitrag anfügen

Symbol:
 
 
 
 
 
 
 
 
 
 
 
 
 

Überschrift: