[18:04] <jo-erlend> noen som vet hvordan jeg unngår at webkit stjeler fokus når jeg bruker WebView.open(url)?
[18:10] <jo-erlend> æsj, det er Google som gjør det med et teit javascript. Det er jo dønn harry.
[18:46] <Kagee> echo '<div><h2 class="trainontime_result">28. mar 04:37 - 06:40' | sed -e 's/^[*.]>2//g'
[18:46] <Kagee> hvorfor funker ikke dette?
[19:12] <citoyen> fordi [] betyr klasse
[19:12] <citoyen> prøv nøyaktig samme streng uten []
[19:12] <citoyen> da mister du riktignok totallet, antar du helst ville beholdt det :P
[19:12] <citoyen> men det er svar på spørsmålet ditt i alle fall
[19:13]  * citoyen highlighter Kagee litt
[19:14] <citoyen> (heter det klasse på norsk forresten? range på engelsk..)
[19:24] <Kagee> citoyen: vel, det funka ikke -_-
[19:24] <Kagee> jeg gjorde som du sa, og droppa [ og ]
[19:25] <Kagee> ok, nå satte jeg .* i riktig rekkefølge, det hjelp
[19:26] <citoyen> ah, ja
[19:26] <citoyen> det gjorde jeg automatisk da jeg testet her :P
[19:34] <citoyen> min erfaring med regex er at hvis du først har gjort en feil, er det ofte håpløst å debugge, i alle fall hvis regexen er litt lang
[19:34] <citoyen> så min metode er som regel å begynne på nytt
[19:35] <citoyen> så måten jeg løste spørsmålet ditt på var å forstå hva du prøvde å oppnå, så skrive regexen på nytt fra bunnen av, og så sammenligne min med din
[19:41] <Kagee> mm
[19:41] <Kagee> men pokker da
[19:41] <Kagee> jeg vil matche på . bortsett fra ^
[19:41] <Kagee> err - bortsett fra >
[19:41] <Kagee> jeg skal fjerne alt fram til første >
[19:44] <citoyen> du vil sitte igjen med ">28. mar 04:37 - 06:40"?
[19:44] <citoyen> nei vent - du vil ha med h2 også?
[19:44] <citoyen> og > som kommer før?
[19:45] <citoyen> om det stemmer, prøv s/^.*></>/g
[19:45] <citoyen> eh
[19:45] <citoyen> om det stemmer, prøv s/^.*></></g
[19:46] <citoyen> sånn!
[19:48] <citoyen> men det kommer jo litt an på hvordan input ser ut
[19:48] <Kagee> det at ( må escapes men ikke [ forvirrer meg litt
[19:50] <citoyen> [ må vel også escapes hvis den kommer på en tvetydig plass?
[19:50] <citoyen> dvs alle andre steder en inni en annen [], iirc
[19:52] <Kagee> citoyen: http://pastebin.com/B220BQWz
[19:52] <Kagee> resultatet
[19:53] <Kagee> oneliner for å bruke med en trigger på en kanal jeg henger på :)
[19:56] <geirha> Du kan la sed gjøre "grepingen"
[19:56] <geirha> sed '/h2 class.../s|...|...|'
[19:57] <Kagee> .... ?
[19:57] <citoyen> husker jeg satt og skrev noen vanvittige regexer for forskjellige tallformater da jeg skrev masteroppgaven
[19:57] <citoyen> tro om jeg kan finne dem igjen...
[19:57] <geirha> i stedet for grep 'h2 class...' | sed 's|...|...|'
[19:59] <citoyen> '^((((0+[1-9]|1[0-2])(-|\.)(0+[1-9]|[1-2][0-9]|3[0-1]))|((0+[1-9]|[1-2][0-9]|3[0-1])(-|\.)(0+[1-9]|1[0-2])))($|((-|\.)[0-9]{2,4}
[19:59] <citoyen> :D
[20:00] <citoyen> det er derfra jeg har regelen om "ikke debug, start på nytt" :P
[20:00] <geirha> hehe
[20:00] <Kagee> geirha: jeg ser ikke helt vordan
[20:00] <Kagee> +h
[20:01] <geirha> sed -n '/h2 class="trainontime_result"/s|^[^"]*[^>]*>\([^<]*\)[^"]*[^>]*>\([^<]*\).*|\1, \2|p'
[20:01] <geirha> Glemte -n og p i stad
[20:02] <Kagee> aha
[20:02] <geirha> citoyen: Du er ikke helt på høyde med regexen for å validere en e-postadresse  http://www.ex-parrot.com/~pdw/Mail-RFC822-Address.html 
[20:02] <geirha> :P
[20:02] <citoyen> hehe, nei
[20:04] <Kagee> http://pastebin.com/RVxbvY85 sed only
[20:04] <Kagee> citoyen: takker
[20:05] <citoyen> np
[20:12] <geirha> lynx -nolist -dump 'http://m.nsb.no/category3887.html?html_type=html_web_4_0&trainontimesearch-departure_station=GJ%C3%98VIK&trainontimesearch-arrival_station=lunner&layout=simple&device_id=google_chrome' | sed -n '/^[^[:blank:]]/{N;N;s/\n\n/, /;p}'
[20:14] <geirha> Har du sjekket om det ikke er noe API du kan bruke? Å trøske gjennom html med grep/sed/awk feiler fort.
[20:14] <Kagee> ikke egnetlig
[20:16] <Kagee> jeg tror jeg spør dem på twitter :)