[00:24] <Guest90609> moin,wo kann ich bei ubuntu bzw. xubuntu sehen welche programme ich nach der betriebssysteminstallation alle installiert habe?
[00:51] <tomreyn> Guest90609: "dpkg -l | grep ^i" in einem temrinal zeigt dir die installierten pakete
[00:51] <tomreyn> Guest90609: ansonsten gibt's das startmenü, da sind ja die programme mit startern eingetragen
[00:52] <Guest90609> allo tomreyn..danke
[00:53] <Guest90609> ich hab gerade mal in synaptic unter installiert geschaut,aber ich will nur die programme welche ich nach dem systeminstall nachträglich installiert habe auflisten 
[00:53] <tomreyn> wenn du alt-f2 drückst kannst du auch nach programmen suchen
[00:53] <tomreyn> ah okay, das ist bisschen schweiriger, da hab ich vergessen wie das geht
[00:53] <Guest90609> aso
[00:54] <Guest90609> ich bin gerade nochmal die bashhistory durchgegangen 
[00:54] <Guest90609> aber irgendwie doof
[00:54] <tomreyn> Guest90609: also ein weg wäre durch die logs zus chauen, die liegen unter /var/log/apt/term.log
[00:55] <Guest90609> falls bleachbit ds nicht gelöscht hat ;)
[00:55] <Guest90609> ich schau mal eben 
[00:56] <tomreyn> probier mal das:  comm -23 <(apt-mark showmanual | sort -u) <(gzip -dc /var/log/installer/initial-status.gz | sed -n 's/^Package: //p' | sort -u)
[00:56] <tomreyn> https://askubuntu.com/questions/2389/generating-list-of-manually-installed-packages-and-querying-individual-packages
[00:56] <le_bot> Title: apt - Generating list of manually installed packages and querying individual packages - Ask Ubuntu (at askubuntu.com)
[00:56] <Guest90609> der log startet ab 3.10 ..geht nicht
[00:57] <tomreyn> mit dem ebeen geposteten befehl geht es
[00:57] <tomreyn> ist aber vermutlich nicht 100% korrekt
[00:58] <Guest90609> da steht noch soviel anderes bei 
[00:58] <Guest90609> usatzlibarys usw
[00:58] <Guest90609> zusatzlibarys
[00:58] <tomreyn> besser wirds nicht
[00:58] <Guest90609> das verwirrt alles 
[00:58] <Guest90609> ok 
[00:58] <Guest90609> trotzdem danke
[00:59] <tomreyn> bitte
[00:59] <Guest90609> :)
[08:37] <unix_> hi
[09:52] <MojoDodo> Guten Tag, ich hätte da mal ne Frage zur Aktualisierungsverwaltung unter Ubuntu 16.04:
[09:52] <MojoDodo> Ich habe bei "Automatisch nach Aktualisierungen suchen" "Alle zwei Wochen" eingestellt und bei "Wenn andere Aktualisierungen verfügbar sind" "Alle zwei Wochen anzeigen". Trotzdem bekomme ich auch nach einer durchgeführten Aktualisierung direkt am nächsten Tag schon wieder die Meldung der Aktualisierungsverwaltung angezeigt. Habe das "Problem" auf 3 Rechnern mit Ubuntu 16.04
[09:52] <MojoDodo> ich hätte einfach gerne, dass sich die Aktualisierungsverwaltung nur alle 2 Wochen meldet
[14:07] <Rolfi> Hallo! Hat bitte jemand die Geduld, einen Senior bei der Einrichtung eines OCR-Programmes (Texterkennung vom Scanner) zu begleiten?
[14:09] <Rolfi> Ubuntu 16.04 LTS 64 bit. Ich möchte die Vokabeln aus dem Lehrbuch einscannen und mit OCR in Text umwandeln. Habe die
[14:09] <Rolfi> https://wiki.ubuntuusers.de/Texterkennung/ gelesen und scheitere schon bei Auswahl und Installation.
[14:09] <le_bot> Title: Texterkennung › Wiki › ubuntuusers.de (at wiki.ubuntuusers.de)
[14:27] <tomreyn> Rolfi: Hallo. Ich hab das noch nie gemacht, aber da dieser Artikel alles notwendige zu beschrieben scheint könnte ich Dich wahrscheinlich unterstützen.
[14:27] <tomreyn> Rolfi: du fragst dich also grade welche anwendungen / pakete du installieren solltest?
[14:28] <Rolfi> Ja, offenbar ist mein Problem XSANE
[14:28] <tomreyn> so wie ich das lese würde ich tippen dass man mit YAGF, XSane und wahlweise Cuneifom-Linux und Tesseract am weitesten kommt
[14:28] <tomreyn> woran machst du fest dass es ein problem gibt?
[14:28] <Rolfi> Ja, hab YGAF installiert, komm aber nicht klar
[14:29] <tomreyn> geht das genauer?
[14:29] <Rolfi> Also: Ich rufe YGAF auf und darin den Scan
[14:30] <Rolfi> der führt zu xsane
[14:30] <tomreyn> ja, und dann?
[14:31] <tomreyn> da sollte also "xsane"-fester aufpoppen was "scanning for devices" schriebt
[14:31] <Rolfi> Ich scanne ein und dann bekomme ich den Scan nicht ins YGAF
[14:32] <tomreyn> aha okay, also stimmt mit der kommunikation zwischen XSane und YAGF (nicht "YGAF") was nicht.
[14:32] <tomreyn> das kann ich hier mangels scanner jetzt leider nciht nachstellen
[14:32] <Rolfi_> Ich scanne im Fenster und dann passiert nichts mehr
[14:33] <tomreyn> bzw. ich hab schon nen scanner, aber den müsst ich erst mal eben anschließen und einrichten. das hatte ich eh mal vor, würde aber wohl so 20 minuten dauern schätze ich. 
[14:33] <tomreyn> ist deine internetverbindung eben zusammengebrochen?
[14:33] <Rolfi_> Ja, eben Internet unterbrechung
[14:34] <tomreyn> dann wiederhole ich nochmal:
 Ich scanne ein und dann bekomme ich den Scan nicht ins YGAF
 aha okay, also stimmt mit der kommunikation zwischen XSane und YAGF (nicht "YGAF") was nicht.
 das kann ich hier mangels scanner jetzt leider nciht nachstellen
[14:34] <Rolfi_> Prima, warte gerne 20 min. Danke für Dein Angebot!
[14:34] <tomreyn> ok, bis gleich
[14:35] <Rolfi_> Ja, XSANE ist nach meiner Meinung das Problem.
[14:42] <Rolfi> tomreyn: Das Problem ist eindeutig XSANE: Wenn ich damit scanne, wird die Internet-Verbindung unterbrochen, obwohl 
[14:43] <Rolfi> der Scanner über Kabel läuft.
[14:46] <tomreyn> Rolfi: dann schon mal zwei empfehlungen: installier dir ein richtiges IRC-programm, z.B. hexchat, damit kann man hier viel besser chatten und es handhabt auch verbindungsabbrüche besser als der webchat. ist auch schnell gemacht, und das Freenode-Netzwerk ist da schon voreingerichtet.
[14:46] <tomreyn> das war die erste. die zweite ist folgende:
[14:46] <tomreyn> !irclogs
[14:46] <tomreyn> !logs
[14:46] <le_bot> Die Logs der Ubuntu Support- und Loco-Kanäle findest du unter: http://irclogs.ubuntu.com/
[14:47] <Rolfi> okay. such mal hexchat. Moment bitte.
[14:47] <tomreyn> prima, ich brauch auch noch paar minuten
[14:53] <Lausefuchs> wenn der Unterbruch lange genug fuer ein Webchat timeout ist, dann wird ziemlich sicher auch HexChat wegsterben 
[14:53] <Lausefuchs> das so am Rande 
[14:56] <Rolfi> tomreyn: unter hexchat lande ich auf einem englischen Ubuntu-Chat.
[15:03] <Rolfi> Hallo tomreyn, stehen wir noch in Verbindung?
[15:04] <tomreyn> Rolfi: ja
[15:05] <tomreyn> das war dann doch mehr als 20 minuten bei mir ;)
[15:06] <Rolfi> kein Problem. Wie kann ich Dir ein pdf der Seite senden, die ich aufbereiten und mit OCR einlesen will (Damit Du eine Vorstellung hast)
[15:07] <Rolfi> paste nimmt pdf nicht an
[15:07] <tomreyn> Rolfi: du könntest sie hochladen irgendwo und dann mir den download-link geben
[15:08] <Rolfi> Entschuldigung, bin Senior. Wo könnte ich sie hinladen?
[15:08] <tomreyn> https://mega.nz/ zum beispiel
[15:08] <le_bot> Title: MEGA (at mega.nz)
[15:09] <tomreyn> "ohne anmeldung testen"
[15:10] <tomreyn> Rolfi: sorry, das war ein schlechter tipp, das funktioniert erst nach anmeldung
[15:11] <Rolfi> https://mega.nz/fm/5XYSBBwA
[15:11] <le_bot> Title: MEGA (at mega.nz)
[15:12] <Rolfi> Mein erstes Problem ist noch nicht die Bearbeitung, sondern XSANE
[15:14] <Rolfi> Habe bisher nur mit Simple Scan gearbeitet. Das hat auch funktioniert. Xsane stürzt aber ab.
[15:15] <Rolfi> Wenn ich mit Simple Scan ein pdf erzeuge, wie kriege ich das in YAGF?
[15:17] <tomreyn> ich kann dich beruhigen, hier stürzt es auch ab :)
[15:17] <tomreyn> https://mega.nz/fm/5XYSBBwA kann ich leider nicht erreichen, das benötigt zugangsdaten
[15:17] <le_bot> Title: MEGA (at mega.nz)
[15:18] <tomreyn> ich habe eben nach einem anbieter gesucht der ohne nerviges zeugs auch das hochladen von pdf-dateien ohne acocuntregistrierung ermöglicht aber auf die schnelle keinen gefunden
[15:18] <Rolfi> als Anhang in eine e-Mail an Dich?
[15:18] <tomreyn> die meisten internetzugangsanbieter bieten ihren kunden inzwischen kostenlosen uploadspeicher, auf den man auch anderen leuten dateien bereit stellen kann. bietet deiner sowas vielleicht auch?
[15:19] <tomreyn> wenn die datei kleiner als 10 MB ist kannst du sie auch gerne an tomreyn bei megaglest punkt org senden
[15:21] <tomreyn> oh bei mir ist aber nicht xsane gecrashed sondern yagf
[15:22] <tomreyn> Rolfi: in YAGF gibt es im "File"("Datei")-Menü eine Option "Import from PDF"
[15:23] <tomreyn> leider stürzt YAGF bei mir dabei auch ab.
[15:24] <Rolfi> Genau. Danach Absturz.
[15:24] <Rolfi> pdf gemailt
[15:27] <Rolfi> Bei YAGF -> Scan -> (Scanner läuft) -> nichts
[15:27] <tomreyn> danke. kannst du xsane mal aus nem temrinal heraus aufrufen und dann nen scan anstoßen und dann den text aus dem terminaol nach paste.ubuntu.com pasten?
[15:28] <Rolfi> gerne.
[15:29] <tomreyn> das klappt bei ir alles ohne crash
[15:30] <tomreyn> bei *m*ir
[15:30] <Rolfi> Frage: bei XSANE 2. Zeile im Window: Suche nach Bild-Dateinamen Was ist da gemeint?
[15:31] <Rolfi> bei mir voreingestellt: out.pnm    Ist das okay?
[15:31] <tomreyn> das ist der name der datei in die das gescannte bild gespeichert wird
[15:31] <tomreyn> die deutsche übersetzung ist da wohl mist
[15:32] <tomreyn> out.pnm ist an sich ok. PNM ist "portable network iMage", ein bilddateiformat. du könntest es auch als PDF speichern
[15:32] <Rolfi> bekomme gescanntes Bild auf den Bildschirm.
[15:32] <tomreyn> als bilddatei sit aber schon ko
[15:33] <tomreyn> und speichern klappt auch? über das datei-menü?
[15:33] <tomreyn> ähm blödsinn das ist nicht im dateimneü, du hast es eben schon gespeichert
[15:34] <Rolfi> ja. Zunächst ist die out.pnm nirgends zu finden, aber nach dem Speichern übers Menü schon.
[15:35] <tomreyn> ah okay
[15:35] <Rolfi> XSANE liefert jetzt eine sehr verspätete Fehlermeldung: Unerwartet beendet
[15:35] <tomreyn> dann ist jetzt die frage womit wir die bilddatei weiter bearbeitne wollen
[15:36] <tomreyn> na prima. :-/    aber solange die datei gespeichert wurde ist das ja ok.
[15:36] <Rolfi> Von Simple Scan gibt es leider nur pdf.
[15:37] <tomreyn> das ist ja an sich okay, es muss dann halt im nächsten schritt noch von einem anderen programm aus dem PDF ein text gemacht werden
[15:38] <tomreyn> das ist die aufgabe der programme die in der farbigen tabelle auf https://wiki.ubuntuusers.de/Texterkennung/#OCR-Programme-mit-grafischer-Oberflaeche aufgelistet sind
[15:38] <le_bot> Title: Texterkennung › Wiki › ubuntuusers.de (at wiki.ubuntuusers.de)
[15:38] <tomreyn> beim versuch eine PNM-datei in YAGF reinzuladen crasght das bei mir mal wieder
[15:38] <Rolfi> YAGF nimmt auch nicht die von XSANE gemachte pnm-Datei, obwohl für pnm ausdrücklich vorgesehen.
[15:38] <frostschutz> pnm ist riesig (wie tiff), png ist kleiner (verlustfrei), jpeg viel kleiner (verlustbehaftet)
[15:39] <tomreyn> ich habe eben auch nochmal OCRFeeder statt YAGF zum scannen probiert, aber der findet noch nicht mal meinen scanner.
[15:39] <Rolfi> Ich finde, wir sollten YAGF aufgeben und Alternativen suchen.
[15:39] <tomreyn> ich auch :)
[15:42] <tomreyn> also mit ocrfeeder kann ich eine PNM-datei öffnen und tesseract drüber laufen lassen
[15:42] <Rolfi> Wenn ich die Ubuntu-Anleitung richtig verstehe, sollten wir etwas mit Cuneiform oder tesseract nehmen.
[15:42] <tomreyn> das ergebnis ist bei mir sehr mies, aber ich habe auch keine gute vorlage. ich versuch es gleich nochmal mit deinem pdf
[15:42] <Rolfi> okay. Werde ocrfeeder installieren.
[15:42] <tomreyn> installier mal ocrfeeder,
[15:42] <tomreyn> :)
[15:43] <tomreyn> Tut mir leid dass ich nicht besser helfen kann, muss mir das halt auch alles parallel erst mal erarbeiten
[15:43] <Rolfi> Meine Vorlage muß noch bearbeitet werden (machen wir später). Nimm besser erst mal ne einfache deutsche DIN A4 -Seite mit einem Text
[15:45] <tomreyn> stimmt, deine pdf-datei muss noch gedreht und druch unpaper gefiltert werden
[15:48] <Rolfi> ocrfeeder nimmt auch nichts vom Scanner
[15:50] <Rolfi> ocrfeeder startet nur auf Kommando-Ebene, vom Button nicht.
[15:51] <tomreyn> hmm, ok, vom scanner klappte das bei mir ja auch nicht
[15:51] <tomreyn> aber kannst du die datei da einladen?
[15:53] <Rolfi> ja
[15:53] <tomreyn> hab dir eben eine aufbereitete variante deiner PDF-datei geschickt
[15:54] <tomreyn> die müsstest du in ocrfeeder einladen können
[15:57] <tomreyn> hmm die ergebnisse sind nicht zufriedenstellend
[15:57] <Rolfi> Danke, angekommen. OCRfeeder nimmt die an, aber die Ausgabe als odt ist leer.
[15:57] <Rolfi> wir müsen die Vorlage z.B. mit unpaper aufbereiten
[15:57] <tomreyn> das liegt vermutlich an der spracheinstellung. mit englisch bekomme ich text, aber der ist zu 90% sinnfrei
[15:58] <tomreyn> unpaper hatte ich schon gemacht, aber das hat da jetzt auch keinen unterschied gemacht
[15:58] <tomreyn> gut wäre es wenn du nochmal neu scannst mit höherer auflösung
[15:58] <tomreyn> also mit simplescan dann wohl
[15:59] <Rolfi> und wenn man mit tesseract und cuneiform herumspielt?
[15:59] <Rolfi> Ich scan noch mal
[16:01] <tomreyn> cuneiform gibt's halt nicht als fertiges paket, da müssten wir dann erst mal suchen
[16:01] <tomreyn> äh doch gibt's schon als paket, aber nur für die kommandozeile
[16:02] <tomreyn> das grafische quneiform-qt gibts nicht als paket in den standard-repositories.
[16:03] <Rolfi> Ist doch in ocrfeeder drin; siehe Einstellungen
[16:04] <tomreyn> ach ja stimmt
[16:05] <Rolfi> Hab nen Ausschnitt hochaufgelöst neu gescannt. Sind aber 32 MB geworden. Wie kann ich Dir das (unaufbereitet) mailen?
[16:05] <tomreyn> was ist es denn für ein dateiformat jetzt?
[16:08] <tomreyn> hmpf, ocrfeeder ist mir auch eben gecrasht beim versuch mit der cuneiform-engine deine alte bilddatei zu interpretieren
[16:08] <tomreyn> ich muss sagen ich bin ein bisschen enttäuscht wie problematisch das in 2017 noch alles ist...
[16:11] <tomreyn> okay, tesseract ohne sprachauswhl bringt halbwegs nutzbare ergebnisse 
[16:11] <Rolfi> Also, den Ausschnitt habe ich in png = 32 MB, in pdf = 0 MB (ging offenbar nicht) und JPEG noch nicht probiert.
[16:13] <Rolfi> ah, super! pdf nur 2,7 MB
[16:13] <tomreyn> hmm, hoffentlich ging da nicht so viel verloren jetzt.
[16:14] <tomreyn> aber das ist immerhin schon mal die 5-fache dateigröße der ersten pdf-datei
[16:15] <Rolfi> ah, pdf und jpeg fast gleich groß. Schicke ich dir.
[16:15] <frostschutz> selbst wenn man es zum laufen bringt, ist das ergebnis meist enttäuschend. windows-vm und dort eine OCR software und gut (und selbst die können lange nicht alles fehlerfrei erkennen)
[16:18] <tomreyn> also an sich geht das schon zu machen http://www.free-ocr.com/FW/getfile.php?file=11f05d83111454eebd1c9704806f5c0b%2Ftest01.txt
[16:19] <Rolfi> frostschutz: Welche Win-OCR ist zu empfehlen?
[16:20] <Rolfi> tomreyn: Wie hast Du das hingekriegt?
[16:20] <tomreyn> Rolfi: ich hab es voni dieser website machen lassen
[16:21] <tomreyn> http://www.free-ocr.com/de.html  - dann die von mir an dich per mail vorhin geschickte PNG-datei ausgewählt und deutsch + spanisch als sprachen ausgewählt
[16:21] <tomreyn> ich würde mal annehmen dass die das auch alles unter linux machen
[16:22] <tomreyn> nur halt mit der richtigen software und den richtigen einstellungen vermutlich ;)
[16:22] <tomreyn> jetzt müsste man nur noch wissen was "richtig" ist
[16:22] <frostschutz> und welche software nutzen die? free heisst ja nicht open source ;) und die seite ist werbeverseucht, wirkt alles doch sehr kommerziell da. und für linux gibts ja auch kommerzielle lösungen, nur halt für ein heidengeld und dann meist nur als sdk ohne front-end
[16:23] <frostschutz> Rolfi, keine ahnung, was zu empfehlen ist. in meinem fall eine steinzeitversion von abbyy finereader
[16:23] <tomreyn> auf dem server läuft jedenfalls ein SSH-2.0-OpenSSH_6.7p1 Debian-5+deb8u3
[16:24] <tomreyn> vielleicht verraten die es ja wenn man mal nett fragt
[16:28] <Rolfi> Interessant der Unterschied dort zwischen der ursprünglichen Version und der von dir mit unpaper vorbereiteten Version.
[16:29] <tomreyn> mit ursprünglich meinst du das PDF was du mir geshcikt hattest?
[16:29] <Rolfi> Was mich immer wundert: Kann man dem OCR nicht wesentlich helfen, wenn man den Schrifttyp vorgibt? Aber danach wird gar nicht gefragt.
[16:30] <tomreyn> ich hatte ja die von mir schon bearbeitete version (ohne seitenzahlen und in graustufen mit weniger farben) hochgeladen
[16:30] <Rolfi> ja, nur gedreht und ausgeschnitten.
[16:30] <tomreyn> es gitb SO viele schriftarten, das würde denke ich kaum sinn ergeben.
[16:31] <Rolfi> deshalb ja gerade.
[16:31] <Rolfi> Aber egal. Was machen wir nun?
[16:32] <tomreyn> ich bin ein bisschen ratlos, was ist denn dein ziel?
[16:33] <tomreyn> wenn du mit schriftartendateien arbeiten wolltest müsstest du halt pro kombination aus schriftartendatei und sprache ein eigenes trainingsdatenset haben. und der user müsste die scxhriftart halt immer wissen und korrekt angeben und die müsste auch unterstützt werden.
[16:33] <Rolfi> Ziel ist, das Vokabelheft mit 50 Seiten auf den PC zu bringen. Weitere Programme probieren?
[16:34] <tomreyn> am besten alle 50 seiten mit hoher auflösung scannen und als TIF abspeichern, dann unpaper drüber laufen lassen, dann tesseract drüber laufen lassen
[16:35] <tomreyn> ich würde das dann alles auf der kommandozeile machen
[16:35] <tomreyn> oh und die grafik noch rotieren zwischendrin
[16:35] <Rolfi> 1. Simple Scan hat kein TIF
[16:36] <Rolfi> 2. Welche Einstellungen hast Du bei unpaper genommen?
[16:36] <Rolfi> 3. unpaper rotiert doch automatisch, oder?
[16:37] <Rolfi> Ah, Du meinst Wechsel zu Win?
[16:39] <tomreyn> achso, na ja was immer simple scan anbietet, pdf geht auch
[16:39] <tomreyn> unpaper nutze ich mit default-einstellungen
[16:39] <Rolfi> YGAF können wir wohl deinstallieren, oder?
[16:39] <tomreyn> ob es automatisch rotiert weiß ich nicht, gut möglich
[16:39] <tomreyn> ja, hab ich hier schon runter geworfen
[16:41] <tomreyn> hmm tesseract mit deutschem sprachprofil kriege ich irgendwie nicht hin
[16:43] <Rolfi> du bist noch bei ocrfeeder?
[16:44] <tomreyn> ah man muss da noch zusätzliche pakete installieren für die zu unterstützenden sprachprofile
[16:44] <tomreyn> tesseract-ocr-deu und tesseract-ocr-spa in unserem fall
[16:46] <Rolfi> Vorsicht! Gilt das auch für Ubuntu Version 16.04 LTS 64 bit?
[16:47] <tomreyn> ja, die hab ich hier auch
[16:47] <tomreyn> und yeay, das klappt viel besser
[16:49] <tomreyn> hier das OCR-ergebnis für den oberen linken block mit OCRFeeder uind tesseract nach installation der pakete und unpaper-lauf: test04.jpg: http://paste.ubuntu.com/25786748/
[16:49] <le_bot> Title: Ubuntu Pastebin (at paste.ubuntu.com)
[16:50] <Rolfi> ui, sieht prima aus!
[16:50] <tomreyn> leider kann der aber wohl nur eine sprache pro datei, d.h. du kannst zwischen duetschem text mit umlauten oder spanischem text mit entsprechenden akzenten und sonderzeichen wählen aber nicht beides haben
[16:50] <tomreyn> oder du müsstest halt zwei dateien drauf machen
[16:51] <tomreyn> ach doch sprachauswhl geht auch pro block mit ocrfeeder, prima
[16:52] <tomreyn> ja das klappt
[16:53] <tomreyn> leider musst du das dann aber halt für jede der 50 seiten separat die sprachzuweisung zu den einzelnen erkannten textblöcken machen.
[16:53] <Rolfi> in ocrfeeder gibt es "Bild begradigen"
[16:53] <tomreyn> du meinst um es zu rotieren?
[16:55] <Rolfi> so verstehe ich es
[16:55] <tomreyn> ah ja das ist um eine einheitliche grundlinie zur beesseren texterkennung rein zu bekommen
[16:55] <tomreyn> ich weiß nicht ob der komplette rotationen macht, ich denke da geht es eher darum kleine prozente auszugelichen, sowas wie es durch welliges papier entstehen würde
[16:56] <tomreyn> ist dir jetzt klar wie du also vorgehen könntest? sollen wir nochmal durchgehen?
[16:57] <tomreyn> Rolfi: ^
[16:59] <Rolfi> Ja, aber Moment bitte, hab gerade Telefon.
[17:00] <tomreyn> achso, ja klar, dann meld dich einfach gleich nochmal :)
[17:01] <Rolfi> Bin wieder da. Entschuldigung!
[17:02] <Rolfi> Hab die beiden Erweiterungen installiert.
[17:05] <Rolfi> Also was ist unser Ergebnis?
[17:06] <Rolfi> 1. Scannen mit Simple Scan mit hoher Auflösung speichern unter ??
[17:07] <tomreyn> Rolfi: ja, genau. am besten in dem schritt auch schon drehen falls das mit simple scan geht
[17:08] <tomreyn> ja das geht im menü
[17:08] <tomreyn> und über die tasten [ und ]
[17:09] <Rolfi> welches Ausgabeformat?
[17:09] <tomreyn> im menü 'seite' kannst du unter 'zuschneiden' -> 'Angepasst' auch direkt den zu scannenden bereich festlegen
[17:10] <tomreyn> Unter 'Dokument' -> 'Scan' kannst Du den Modus "Text" festlegen. ich würde es als PNG speichern.
[17:11] <Rolfi> okay png
[17:12] <Rolfi> In ocrfeeder einlesen
[17:13] <tomreyn> okay der "text"-modus klappt hier nicht, man muss doch als "grafik" scannen in simple scan
[17:13] <tomreyn> genau, der nächste schritt ist das einlesen in ocrfeeder
[17:13] <tomreyn> da müssen wir ggf. einmalig noch ein paar grundeinstellungen machen:
[17:14] <Rolfi> okay, welche?
[17:14] <tomreyn> Unter Bearbeiten -> Einstellungen
[17:14] <tomreyn> -> tab "werkzeuge"
[17:14] <tomreyn> im unteren bereich "unpaper images" aktivieren
[17:15] <tomreyn> und im rechten tab "erkennung": Standardsprache = Deutsch
[17:15] <tomreyn> ach so und im tab "werkzeuige" die OCR-Engine "Tesseract"
[17:15] <tomreyn> das sollte aber an sich schon gesetzt sein
[17:16] <tomreyn> dann "ok".
[17:18] <tomreyn> jetzt kannst du alle vorher mit simple scan gescannten bilddateien per "Datei"-> "Ordner hinzufügen" in das OCRFeeder-Projekt einladen. dann das projekt einmal als solches speichern - im OcrFeeder-eigenen Dateiformat.
[17:18] <tomreyn> Das kann man dann später wieder laden falls es abstürzt
[17:18] <Rolfi> Moment bitte. Kann gerade nicht zwei Einstellungsfenster gleichzeitig aufmachen und muß springen.
[17:19] <tomreyn> ok
[17:21] <Rolfi> Okay. Markiere jetzt die deutsche Spalte per Maus und stelle tesseract-deu ein.
[17:22] <Rolfi> Genauso zweite Spalkte mit tesseract spa
[17:22] <tomreyn> per maus markierne musst du eigentlich gar nicht, nur sie nach der erkennung anklicken und die sprache zuweisen
[17:22] <tomreyn> aber vielleicht meinst du das auch
[17:24] <tomreyn> und ich sehe grade dass du ja doch die schriftart auswählen kannst
[17:24] <Rolfi> Nicht verstanden: Eine automatische Spaltenerkennung sehe ich nicht.
[17:25] <tomreyn> aber ich schätze das ist nur die in  der es ausgegeben wird, beeinflusst nicht den OCR-vorgang
[17:25] <tomreyn> die spaltenerkennung ist nicht automatisch, aber die erkennung von textrblöcken
[17:25] <Rolfi> die erzeugt ODT-Datei ist leider leer.
[17:25] <tomreyn> Klick mal auf das zweite Icon unter der Menüzeile mit dem blau eingefärbten Text.
[17:26] <tomreyn> dann solltest du nach einer weile seiten mit mehreren blau eingefärbten textblöcken bekommen
[17:26] <tomreyn> denen kannst du dann jeweils die sprache zuweisen
[17:27] <tomreyn> ...indem du sie einmal mit der maus anklickst und dann rechts unter "texteigenschaften" im tab "Sonstiges" die Sprache auswählst
[17:27] <tomreyn> die häkchen vor den sprachen da einfach ignorieren
[17:28] <Rolfi> okay. 
[17:29] <tomreyn> wenn du für einen block die sprachzuweisung geändert hast dann kannst du nochmal auf das linke tab "text" gehen und dort nochmal auf OCR drücken, dann sollte sich der erkennate text ändern
[17:29] <Rolfi> Und jetzt auf 3. Button der Menüzeile
[17:29] <tomreyn> oder ist es immer noch leer?
[17:30] <tomreyn> erst mal muss das OCR klappen, danach machen wir erst den ODT-export 
[17:30] <Rolfi> ah, prima!
[17:30] <Rolfi> sieht gut aus.
[17:31] <tomreyn> okay wenn das OCR klappt dann bitte nochmal das OCRFeeder-projekt speichern, nciht dass der beim ODT-Export crasht und dann die sprachzuordnungen der textblöcke verloren gehen.
[17:33] <tomreyn> okay, am ende musst du dann wahrscheinlich auch nochmal in libreoffice die ODT-datei öffnen und dort korrekturen vornehmen, also fehlerhaft erkannte buchstaben / akzente korrigieren und auch dafür sorgen dass die deutschen / spanischen vokabeln jeweils alle auf der gleichen zeiele sind
[17:36] <Rolfi> Klar, super. In der Textdatei lasse ich die Rechtschreibprüfung laufen und dann ab ins Tabellenformat ods, xls, oder csv.
[17:38] <tomreyn> ah ja das ist ne gute idee
[17:38] <Rolfi> tomreyn, Du hast mir sehr geholfen! Herzlichen Dank! Ich bin schon etwas älter und noch mit Lochstreifen groß geworden
[17:39] <Rolfi> Dann kam DOS. Dort gab es Stapelbetrieb. Weißt Du zufällig, wie man heute Stapelbetrieb macht?
[17:39] <tomreyn> Rolfi: Wenn Du wüsstest wie einfach das mit Dir im Vergleich zu meiner Mutter geht - da sind Welten dazwischen!
[17:40] <tomreyn> ich glaub ich weiß nicht mal was Stapelbetrieb ist. Ich kenne Batch-Dateien, meinst Du sowas?
[17:40] <Rolfi> Ja, genau! Wenn ich die 50 Dateien per Hand gescannt hab, würde ich die natürlich gerne automatisch weiterverarbeiten.
[17:41] <tomreyn> unter windows heißen die auch weiterhin batchdateien (.bat). unter linux heißen die Shellskripte (.sh).
[17:41] <Rolfi> Nur ein Tipp, unter welchem Stichwort man heute Batch macht.
[17:41] <tomreyn> aber es funktioniert recht ähnlich
[17:42] <tomreyn> https://wiki.ubuntuusers.de/Shell/Bash-Skripting-Guide_f%C3%BCr_Anf%C3%A4nger/
[17:42] <le_bot> Title: Bash-Skripting-Guide für Anfänger › Shell › Wiki › ubuntuusers.de (at wiki.ubuntuusers.de)
[17:43] <Rolfi> Danke. Das lese ich mir mal durch. Vielen Dank für Deine Hilfe und Dein Verständnis für Senioren!
[17:44] <tomreyn> Sehr gerne, Rolfi, viel Erfolg weiterhin :)
[17:45] <tomreyn> hab auch einiges gelernt heute
[17:45] <tomreyn> und nebenbei noch mein drucker / scanner / fax-kombi eingerichtet.
[17:47] <Rolfi> Schönes Wochenende!
[17:47] <tomreyn> Wenn Du mit Stapeldateien vertraut bist und die Vorzüge davon kennst dann wirst Du Shellskripting lieben. Das ist nämlich unter Linux *viel* besser als unter Windows umgesetzt.
[17:47] <tomreyn> Ciao!
[18:10] <jetztodernie__> hallo, wie kann ich von der konsole aus ein dist-upgrade auf 17.10 einleiten?
[18:11] <Frickelpit> jetztodernie__: sudo do-release-upgrade
[18:20] <jetztodernie__> Frickelpit: danke
[18:20] <Frickelpit> np
[21:14] <RedNifre> wie übergebe ich denn beliebige bytes in einem string als parameter?
[21:15] <RedNifre> ich habe hier ein python-script das ein LCD ansteuert. Ich würde zum Beispiel gerne im String-Parameter für das Tool byte 1 oder auch byte 127 senden, geht das? Mein Terminal ist vermutlich in UTF-8, also passt das ja eigentlich nicht so richtig.
[21:44] <Rolfi> Hallo, ein Dropdown-Menü spinnt. Kann jemand bitte helfen?
[21:46] <Rolfi> Ubuntu 16.04 LTS 64 bit, LibreOffice 5 calc, Extras->Rechtschreibung->Textsprache
[21:47] <Rolfi> Ich kann das Dropdown-Menü öffnen, spanisch anklicken, aber der Menü-Punkt wird nicht angenommen
[21:49] <Rolfi> der Menüpunkt heißt genau Spanisch(Spanien), aber es geht mit keinem Punkt.