Forum: Overview Koreanische Sprache - 한국어 / Deutsche Sprache - 독일어 RSS
Software zum Romanisieren gesucht
Abgetrennt aus Deutsche Umschrift
Page:  1  2  next  
This ad is presented to unregistered guests only.
NoBuddy #1
Member since Aug 2006 · 6 posts
Group memberships: Benutzer
Show profile · Link to this post
Entsprechend eines Tipps von iGEL habe ich mich mal hier registriert.
Als Einstand hätte ich die Frage, ob sich im Internet Seiten finden lassen, auf denen möglichst lange Text sowohl in Hangeul als auch in korrekter revidierter Romanisierung zu finden sind. Das Programm, das ich zum Romanisieren habe, arbeitet leider erst Stunden lang und stürzt dann auch noch meistens ab.
Avatar
Hong Hu #2
User title: http://tae-yeol.blogspot.com/
Member since Feb 2006 · 493 posts · Location: 마인츠 (^.^) Mainz
Group memberships: Benutzer
Show profile · Link to this post
Ich weiss nciht, was du genau suchst....villeicht hilft dir das http://www.google.com/language_tools weiter.....
http://tae-yeol.blogspot.com/
Moskito (Former member) #3
No profile available.
Link to this post
Jo! Stimme Hong Hu zu.

Mir ist leider nicht klar, was genau Du suchst...mehr Infos bitte!
Avatar
iGEL (Administrator) #4
User title: 이글
Member since Jan 2005 · 3493 posts · Location: Berlin
Group memberships: Administratoren, Benutzer
Show profile · Link to this post
Willkommen an Board, NoBuddy! ^_^

Soweit ich weiß, sucht er nach einer Software, wo man einen koreanischen Satz in Hangeul eingibt und die ihn dann in der Revidierten Romanisierung ausgibt. Leider kenne ich sowas nicht.

Gruß, Johannes
Offizieller Dogil.net / Meet-Korea-Twitter-Kanal: http://twitter.com/DogilNet
Moskito (Former member) #5
No profile available.
Link to this post
Vielleicht will er ja auch so ne Software schreiben...und sucht nun lange Texte um den Erfolg seiner Bemühungen zu überprüfen...

Wäre mal ein interessantes Projekt ;-)
ionic #6
Member since Mar 2006 · 137 posts · Location: Köln
Group memberships: Benutzer
Show profile · Link to this post
Ich wäre auch interessiert an so nem Programm.

Ich wollte mal sowas schreiben, quasi als proxy für IRC im hanirc.org, so dass mir das Hanguel welches andere schreiben direkt romanisiert wird.

Das Problem ist nur, dass die Regeln nicht 100% klar sind, es gibt immer soviele Ausnahmen.

-ionic
Avatar
Hong Hu #7
User title: http://tae-yeol.blogspot.com/
Member since Feb 2006 · 493 posts · Location: 마인츠 (^.^) Mainz
Group memberships: Benutzer
Show profile · Link to this post
In reply to post #5
@ Moskito ich glaube nicht, dass er/sie ein Projekt machen will, sondern das Ergebniss dieses Projektes sucht^^
http://tae-yeol.blogspot.com/
NoBuddy #8
Member since Aug 2006 · 6 posts
Group memberships: Benutzer
Show profile · Link to this post
Moin,
die Überschrift stimmt nicht ganz, ich schreibe tatsächlich selbst etwas und Suche nach einer Möglichkeit das Ergebnis zu überprüfen.
Zz. liegt die Fehlerquote anscheinend bei ca. 3 %, und das ist etwas viel. Wenn ich keinen vertrauenswürdigen Vergleich habe, kann ich aber noch nicht einmal diese Quote sicher sagen oder etwas finden, mit dem das Resultat verbessert werden kann.
ug (Guest) #9
No profile available.
Link to this post
Moin.
Du koenntest es mit Liedtexten versuchen , da gibt es einige Webseiten, die koreanische Popsongs romanisiert haben. Sollte von der Laenge her reichen und da es sich ja um eine formale Transkription und nicht um eine sinngemaesse Uebersetzung handelt sollte auch die poetische Sprache nicht hindern.
Auf http://members.aol.com/kpoplyrics/index.htm gibt es z.B. Unmengen an Lyrics sowohl in Hangeul als auch romanisiert, wobei ich ueber die Qualititaet der Romanisierung nichts sagen kann.
Romanisierte BoA-Texte z.B. auf http://www.boajjang.com/index.php?id=19, die Hangul - Version sollte leicht anderswo aufzutreiben sein ;-)
Hoffe die Idee hilft Dir ein bisschen und ich bin mir sicher es finden sich einige eifrige Beta-Tester hier fuer Dein Programm (^_-)
Avatar
iGEL (Administrator) #10
User title: 이글
Member since Jan 2005 · 3493 posts · Location: Berlin
Group memberships: Administratoren, Benutzer
Show profile · Link to this post
Moin!

Ich habe mir die Links einmal angesehen. Beim ersten wird leider nicht die offizielle Revidierte Romanisierung verwendet, sondern nur eine Ad-hoc-Romanisierung. Der zweite Link sieht schon besser aus, scheint aber auch nicht 100% korrekt zu sein. So fällt mir keine Möglichkeit ein, wie man tt als Auslaut haben kann und die Doppelkonsonanten werden als Anlaut auch anders romanisiert: ㄲ -> kk statt gg, ㄸ -> tt statt dd und ㅃ -> pp statt bb. Auch dass jede Silbe ein einzelnes Wort wird ist natürlich nicht richtig.

Als Betatester stehe ich übrigens zur Verfügung. :)

Gruß, Johannes
PS: Ich kann die Überschrift wieder ändern, wenn du mir sagst, in was.
Offizieller Dogil.net / Meet-Korea-Twitter-Kanal: http://twitter.com/DogilNet
ionic #11
Member since Mar 2006 · 137 posts · Location: Köln
Group memberships: Benutzer
Show profile · Link to this post
Eine Sache die ich gerade nicht verstehe ist, warum das Programm stundenlang arbeiten soll.

Im Grunde dürfte doch die Romanisierung eine relativ triviale Table Lookup Geschichte sein, die ziemlich schnell gehen sollte.

-ionic
Avatar
iGEL (Administrator) #12
User title: 이글
Member since Jan 2005 · 3493 posts · Location: Berlin
Group memberships: Administratoren, Benutzer
Show profile · Link to this post
Moin!

NoBuddy meint glaube ich diese Software, die er bisher zum Romanisieren verwendet: http://mccune-reischauer.org/downloads.html#1 Ich hab sie noch nicht ausprobiert, da ich die meiste Zeit unter Linux arbeite.

Gruß, Johannes
Offizieller Dogil.net / Meet-Korea-Twitter-Kanal: http://twitter.com/DogilNet
NoBuddy #13
Member since Aug 2006 · 6 posts
Group memberships: Benutzer
Show profile · Link to this post
Genau diese.

Die Romanisierung könnte sogar äußerst schnell sein, einfach nur die Silben auseinander nehmen und für die Buchstaben dann die lateinischen Entsprechungen einsetzen. Wie es in der Wikipedia bei Umkehrbarkeit beschrieben ist.
Das offizielle Programm scheint es insgesamt anders zu machen, anscheinend hat es eine Liste mit sämtlichen Johab Silben plus Ansi und holt sich die Buchstaben aus dieser. Außerdem ist die revidierte Romanisierung ja leider eine Ansammlung von Ausnahmen, die die Regeln widerlegen. Vermutlich werden dann auch noch alle Silben gegen diese Ausnahmen getestet. Bei ein paar Tausend zu übertragenden Silben und mehreren Tausend Ausnahmen dauert es eine Weile. Garniert mit einem Absturz macht es erst richtig Spaß. Außerdem ist es mittlerweile auch 6 Jahre alt, kann sein, dass die dortigen Regeln nicht mehr zu den heutigen passen.

Ein "Betatest" wäre keine schlechte Idee, ihr habt sicher bessere Chancen auf Ideen zur Verbesserung zu kommen. Mit dem eigentlichen Programm geht es momentan aber nicht, die Version, die schon im Netz steht, kann mit Hangeul noch nichts anfangen und eine neuere Version ist größtenteils noch Baustelle. Es ist außerdem nur dafür gedacht jeweils einzelne Worte anzuzeigen. Ich könnte aber mein Testprogramm etwas umbauen, so dass es auch außerhalb der IDE verwendbar ist, damit lassen sich auch Dateien anzeigen bzw. umwandeln.
NoBuddy #14
Member since Aug 2006 · 6 posts
Group memberships: Benutzer
Show profile · Link to this post
Ähm, gelten 6 Stunden noch als Doppelpost?

Falls es jemand versuchen möchte, ich habe das Programm mal etwas angepasst. Läuft aber nur auf Win 2000/XPff und Dateien müssen entweder UTF-8 oder koreanisch kodiert sein.

- "Roman" lädt eine Datei und versucht zu romanisieren
- "Jamo", Hangeul aus der dritten Eingabezeile wird in die einzelnen Buchstaben zerlegt
- "Finden" sucht in einer Datei alle Silben mit einem bestimmten Buchstaben (direkt oder Unicode also ᄀ oder 1100)
- "Anzahl" zählt alle Silben in einer Datei und erstellt eine Hitliste

- "Putz" entfernt alles was nicht Hangeul ist und sortiert jeweils 5 Worte in eine Zeile
- Die Pfeile wollen 3 Dateien -> 2 unterschiedliche Romanisierungen zum direkten Vergleich und eine original Hangeul-Datei. Als Format hatte ich mir das Putzen ausgedacht.
- "alle", das gleiche, aber nicht Wortweise sondern komplett durch

Hier hätte ich noch zwei Beispieldateien. Macht keinen Sinn, einen solchen darin zu suchen. "kor.txt" ist wild aus dem Internet zusammenkopiert, Blogs, Werbung etc. und dann noch mit Putz verunstaltet. "kor_rom.txt ist das Ergebnis von RomanWin. Die 3. Datei für einen Vergleich lässt sich mit dem Roman-Button erzeugen.
Avatar
yuki #15
Member since Nov 2005 · 82 posts
Show profile · Link to this post
Noch ein paar Links zum Thema. Zuerst zwei Webseiten, die Romanisierung anbieten. Wie das schon erwähnte Programm zum Download sind auch diese nicht perfekt. Ein Grund liegt darin dass die Revised Romanization leider nicht in allen Fällen kristallklar dokumentiert ist.

http://urimal.cs.pusan.ac.kr/romanWebDll/romanweb.htm
http://www.sori.org/hangul/conv2kr.…?q=%C0%DA%C0%E5%B8%E…

Dann noch eine Datenbank für Namen (Städte, Eisenbahnen, etc.). Dies sind die offiziellen Schreibweisen, wenn ich das richtig verstanden habe. Keine Software um zu konvertieren, aber eine Datenbank,

http://englishname.seoul.go.kr/

Oh, und noch dies: http://en.wikipedia.org/wiki/Wikipedia:Korea-related_topic…

[edit: & Link zu Wikipedia]
Close Smaller – Larger + Reply to this post:
Smileys: :-) ;-) :-D :-p :blush: :cool: :rolleyes: :huh: :-/ <_< :-( :'( :#: :scared: 8-( :nuts: :-O
Special characters:
Page:  1  2  next  
Go to forum
Not logged in.
Lost password · Register
Current time: 2020-10-23, 10:51:41 (UTC +02:00)  ·  Impressum  ·  Datenschutz