Quelle méthode de parsing ?

Comment capturer des données en utilisant WinTask
Dominik
Posts: 1
Joined: 01 Jun 2016, 10:09

Quelle méthode de parsing ?

Postby Dominik » 01 Jun 2016, 10:12

Bonjour,
Je cherche à extraire des informations individuelles de cette page chargée dans Chrome :
http://www.notaires.fr/fr/notaire/vincent-chapoutot-neuille-pont-pierre-37
Je n'arrive pas à obtenir en n champs les n lignes dans la partie SCP. Je peux récupérer tout le paragraphe mais pas les lignes individuellement.

Support
Posts: 55
Joined: 11 Feb 2016, 09:26

Re: Quelle méthode de parsing ?

Postby Support » 02 Jun 2016, 09:42

Bonjour,
Avec l'Espion, vous pouvez pointer chaque champ individuellement et utiliser le descripteur HTML pour chaque valeur. Ensuite l'instruction GetHTMLAttribute permet de récupérer le texte (CONTENT ou INNERTEXT). Voici le code avec des commentaires :

Code: Select all

StartBrowser("CH","http://www.notaires.fr/fr/notaire/vincent-chapoutot-neuille-pont-pierre-37",3)
UsePage("Vincent")
'L'Espion donne le descripteur pour le nom
GetHTMLAttribute("H2[ITEMPROP='name']","CONTENT",nom$)
msgbox(nom$)

GetHTMLAttribute("SPAN[ID='bleu-color',INDEX=2]","CONTENT",member_principal$)
msgbox(member_principal$)

GetHTMLAttribute("SPAN[ITEMPROP='member',INDEX= 1]","CONTENT",member1$)
msgbox(member1$)

GetHTMLAttribute("SPAN[ITEMPROP='streetAddress']","CONTENT",rue$)
msgbox(rue$)
GetHTMLAttribute("SPAN[ITEMPROP='postalCode']","CONTENT",cp$)
msgbox(cp$)
GetHTMLAttribute("SPAN[ITEMPROP='addressLocality']","CONTENT",ville$)
msgbox(ville$)

'ITEMPROP address donne tout le paragraphe donc là il faut faire du parsing
GetHTMLAttribute("SPAN[ITEMPROP='address']","CONTENT",adresse$)
tel$=ExtractBetween$(adresse$,"Téléphone : ",excluded,"",included)
tel$=Left$(tel$,14)
msgbox(tel$)
fax$=ExtractBetween$(adresse$,"Fax :",excluded,"",included)
fax$=Left$(fax$,14)
msgbox(fax$)


GetHTMLAttribute("SPAN[ITEMPROP='telephone']","CONTENT",siteweb$)
msgbox(siteweb$)
GetHTMLAttribute("SPAN[ITEMPROP='faxNumber']","CONTENT",courriel$)
msgbox(courriel$)



Cordialement
Support WinTask


Return to “Extraction de données”

Who is online

Users browsing this forum: No registered users and 1 guest