Language pack for brezhoneg (Breton)
Status: rough draft. This draft has been created from example sentences by non-native speakers. Review from native speakers is required to turn this into a draft. Are there characters missing? Are rarely used characters marked as important? Do the example sentences look good? If you are a native speaker, please send your feedback to: info@nhcham.org.
Character map
The following characters, grouped by Unicode script, are considered for this language pack.
Latin
Common
Greek
Cyrillic
Arabic
Han
Hebrew
Devanagari
Inherited
Armenian
Thai
Katakana
Hiragana
Georgian
Hangul
Tamil
Bengali
Kannada
Gujarati
Gurmukhi
Coptic
Telugu
Lao
Syriac
Thaana
Oriya
Malayalam
Myanmar
Mongolian
Tifinagh
Tibetan
Ogham
Yi
Language pack rules
Starting with all characters that appear in the example sentences, declare the following characters as:
- important: Latin (probable)
- supplementary: (none)
- ignore: Greek (all), Cyrillic (all), Arabic (all), Han (all), Hebrew (all), Devanagari (all), Armenian (all), Thai (all), Katakana (all), Hiragana (all), Georgian (all), Hangul (all), Tamil (all), Bengali (all), Kannada (all), Gujarati (all), Gurmukhi (all), Coptic (all), Telugu (all), Lao (all), Syriac (all), Thaana (all), Oriya (all), Malayalam (all), Myanmar (all), Mongolian (all), Tifinagh (all), Tibetan (all), Ogham (all), Yi (all)
Used Huffman trees
- word offsets: 0 2
- monograms: ( 1 2 a b c d e f g h i k l m n o p r s t u v w y z
- bigrams: 'a 'h -b -d -m -s 00 19 a- ab ad ae ag ak al am an ao ar as at av az añ ba be bl bo br c' ch d' da de di do dr du e- ea eb ec ed eg ei ek el em en eo ep er es et eu ev ez fe ga ge go gr gw ha he hi ho ia id ie ig ij ik il im in io ir is it iv iw iz iñ je ka ke ki ko kr la le li ll lo ma me mi mm mo mp mz n- na nd ne ng ni nn no nt nv oa oc oe ol om on or os ou oz où pa pe pl po pr r- ra re ri rn ro rr ru rv rz sa se si sk so st ta te ti to tr tu ua ud ue ul un ur us ut uz va ve vi vo vr wa we ye za ze zh zi zo
Example sentences
- Bibl ar Yuzevien (pe an Hebreed), anvet "" (Tanac'h) en hebraeg, eo an Testamant kozh evit ar Gristenien.
- Ur rannyezh dinkek eus skourr yezhoù nilotek eo an agwokeg (aguok) komzet e Soudan.
- Un uhelgargiad eus ar stad Roman e oa e Mediolanum (hiziv Milano) pa voe anvet eskob gant ar bobl daoust m'edo c'hoazh e-touez ar gatekizidi.
- Ur rannyezh otomek eo otomeg Tilapa eus familh ar yezhoù otek-mangeek, komzet gant tro-dro da 400 den (1990) e Mec'hiko.
- E-tro 950 eo kroget an impaleriezh d'en em stummañ goude diskar Tu'i Manu'a e Samoa ha Tu'i Pulotu e Fidji.
- Gant an holl luc'heilerezioù e vez kavet enne ur c'honter a dalvez da c'hoût pet luc'heilennoù a zo bet graet gante hag ivez war an dro da fakturiñ ar pratikoù, ar re-se da paeañ ur gevrat kas en dro hervez an niver a luc'heilennoù graet gante.
- World Wide Web zo bet krouet gant Tim Berners-Lee, Sir Timothy J. Berners-Lee e anv klok, bet ganet d'an 8 a viz Mezheven 1955.
- Div rannyezh pennañ ez eus, disheñvel-tre an eil diouzh eben:
- Tebas a zo ivez kêr orin ar familh Taâ, hendadoù Kamose hag Ahmose, dieuberien Egipt eus an Hyksosed.
- Setu dre vras an daou rummad a ya da sevel an Emsav a-vremañ.
Miscellaneous
Example sentences have been downloaded from http://corpora.uni-leipzig.de/downloads/bre_wikipedia_2007_30K-text.tar.gz
Symbol meanings:
Hint: Hover over a character to see its unicode name.