jo-erlend | noen som vet hvordan jeg unngår at webkit stjeler fokus når jeg bruker WebView.open(url)? | 18:04 |
---|---|---|
jo-erlend | æsj, det er Google som gjør det med et teit javascript. Det er jo dønn harry. | 18:10 |
Kagee | echo '<div><h2 class="trainontime_result">28. mar 04:37 - 06:40' | sed -e 's/^[*.]>2//g' | 18:46 |
Kagee | hvorfor funker ikke dette? | 18:46 |
citoyen | fordi [] betyr klasse | 19:12 |
citoyen | prøv nøyaktig samme streng uten [] | 19:12 |
citoyen | da mister du riktignok totallet, antar du helst ville beholdt det :P | 19:12 |
citoyen | men det er svar på spørsmålet ditt i alle fall | 19:12 |
* citoyen highlighter Kagee litt | 19:13 | |
citoyen | (heter det klasse på norsk forresten? range på engelsk..) | 19:14 |
Kagee | citoyen: vel, det funka ikke -_- | 19:24 |
Kagee | jeg gjorde som du sa, og droppa [ og ] | 19:24 |
Kagee | ok, nå satte jeg .* i riktig rekkefølge, det hjelp | 19:25 |
citoyen | ah, ja | 19:26 |
citoyen | det gjorde jeg automatisk da jeg testet her :P | 19:26 |
citoyen | min erfaring med regex er at hvis du først har gjort en feil, er det ofte håpløst å debugge, i alle fall hvis regexen er litt lang | 19:34 |
citoyen | så min metode er som regel å begynne på nytt | 19:34 |
citoyen | så måten jeg løste spørsmålet ditt på var å forstå hva du prøvde å oppnå, så skrive regexen på nytt fra bunnen av, og så sammenligne min med din | 19:35 |
Kagee | mm | 19:41 |
Kagee | men pokker da | 19:41 |
Kagee | jeg vil matche på . bortsett fra ^ | 19:41 |
Kagee | err - bortsett fra > | 19:41 |
Kagee | jeg skal fjerne alt fram til første > | 19:41 |
citoyen | du vil sitte igjen med ">28. mar 04:37 - 06:40"? | 19:44 |
citoyen | nei vent - du vil ha med h2 også? | 19:44 |
citoyen | og > som kommer før? | 19:44 |
citoyen | om det stemmer, prøv s/^.*></>/g | 19:45 |
citoyen | eh | 19:45 |
citoyen | om det stemmer, prøv s/^.*></></g | 19:45 |
citoyen | sånn! | 19:46 |
citoyen | men det kommer jo litt an på hvordan input ser ut | 19:48 |
Kagee | det at ( må escapes men ikke [ forvirrer meg litt | 19:48 |
citoyen | [ må vel også escapes hvis den kommer på en tvetydig plass? | 19:50 |
citoyen | dvs alle andre steder en inni en annen [], iirc | 19:50 |
Kagee | citoyen: http://pastebin.com/B220BQWz | 19:52 |
Kagee | resultatet | 19:52 |
Kagee | oneliner for å bruke med en trigger på en kanal jeg henger på :) | 19:53 |
geirha | Du kan la sed gjøre "grepingen" | 19:56 |
geirha | sed '/h2 class.../s|...|...|' | 19:56 |
Kagee | .... ? | 19:57 |
citoyen | husker jeg satt og skrev noen vanvittige regexer for forskjellige tallformater da jeg skrev masteroppgaven | 19:57 |
citoyen | tro om jeg kan finne dem igjen... | 19:57 |
geirha | i stedet for grep 'h2 class...' | sed 's|...|...|' | 19:57 |
citoyen | '^((((0+[1-9]|1[0-2])(-|\.)(0+[1-9]|[1-2][0-9]|3[0-1]))|((0+[1-9]|[1-2][0-9]|3[0-1])(-|\.)(0+[1-9]|1[0-2])))($|((-|\.)[0-9]{2,4} | 19:59 |
citoyen | :D | 19:59 |
citoyen | det er derfra jeg har regelen om "ikke debug, start på nytt" :P | 20:00 |
geirha | hehe | 20:00 |
Kagee | geirha: jeg ser ikke helt vordan | 20:00 |
Kagee | +h | 20:00 |
geirha | sed -n '/h2 class="trainontime_result"/s|^[^"]*[^>]*>\([^<]*\)[^"]*[^>]*>\([^<]*\).*|\1, \2|p' | 20:01 |
geirha | Glemte -n og p i stad | 20:01 |
Kagee | aha | 20:02 |
geirha | citoyen: Du er ikke helt på høyde med regexen for å validere en e-postadresse http://www.ex-parrot.com/~pdw/Mail-RFC822-Address.html | 20:02 |
geirha | :P | 20:02 |
citoyen | hehe, nei | 20:02 |
Kagee | http://pastebin.com/RVxbvY85 sed only | 20:04 |
Kagee | citoyen: takker | 20:04 |
citoyen | np | 20:05 |
geirha | lynx -nolist -dump 'http://m.nsb.no/category3887.html?html_type=html_web_4_0&trainontimesearch-departure_station=GJ%C3%98VIK&trainontimesearch-arrival_station=lunner&layout=simple&device_id=google_chrome' | sed -n '/^[^[:blank:]]/{N;N;s/\n\n/, /;p}' | 20:12 |
geirha | Har du sjekket om det ikke er noe API du kan bruke? Å trøske gjennom html med grep/sed/awk feiler fort. | 20:14 |
Kagee | ikke egnetlig | 20:14 |
Kagee | jeg tror jeg spør dem på twitter :) | 20:16 |
Generated by irclog2html.py 2.7 by Marius Gedminas - find it at mg.pov.lt!