Language pack for башҡортса (Bashkir)
Status: rough draft. This draft has been created from example sentences by non-native speakers. Review from native speakers is required to turn this into a draft. Are there characters missing? Are rarely used characters marked as important? Do the example sentences look good? If you are a native speaker, please send your feedback to: info@nhcham.org.
Character map
The following characters, grouped by Unicode script, are considered for this language pack.
Cyrillic
Common
Latin
Arabic
Inherited
Unknown
Language pack rules
Starting with all characters that appear in the example sentences, declare the following characters as:
- important: Cyrillic (probable)
- supplementary: Cyrillic (all), A – Z, a – z
- ignore: Arabic (all)
Used Huffman trees
- word offsets: 0 1 2 3 4 5 6 7 8 9
- monograms: " ( , - 1 2 а б в г д е з и й к л м н о п р с т у ф х ч ш э ю я җ ү һ ә ө
- bigrams: (1 00 19 20 а, аб ав аг ад ае аз аи ай ак ал ам ан ап ар ас ат ау аф ач аш ая аң ба бе би бл бо бр бу бы бү бә ва ве ви вы вә га ге гр гъ гы гә да де ди до ду ды дү дә е, еб ев ег ед ез ек ел ем ен еп ер ес ет еш ең за зг зд зе зи зл зм зн зу зы зә иб иг ид ие из ик ил им ин ио ип ир ис ит их ич ия иң йд йл йо йр йт к, ка ке ки кк кл ко кр кс кт ку кч кш кы кү кә кө л) ла лг лд ле ли лк лл лм ло лс лу лы ль лэ лү лә ма мб ме ми мм мн мо му мы мә мө н, на нг нд не ни нк нл нн но нс нт ну нч ны нь нә ов ог ое ок ол ом он ор ос от оч оң п, па пл по пр пу р, ра рб рг рд ре ри рк рл рм рн ро рс рт ру рч рш ры рү рә са се си ск сл со сп сс ст су сы сү сә сө та те ти тк тл тн то тр тт ту ты ть тү тә тө уг уд уе уз уй ук ул ум ун ур ус ут уч уш уы фа фи фә ха хе хи хә ци ча че чи чы чә ша ше ши шк шл шм шт шу шы шә ы, ыг ые ыз ый ык ыл ым ын ып ыр ыс ыт ыч ыш ың ьл ья эл эн эр эш юк яг яд яз як ял ян яр яс ят яш яң җа җи җы җә ңа ңг үг үе үз үл үм үп үр үт үч үш һә ә, әб әг әд әз әй әк әл әм ән әп әр әс әт әх әч әш әя әҗ әү әһ өз өй өл өн өр өс өч
Example sentences
- Сез бу сөйләшүне һаман бер якка - "Әгәр немецлар җиңсәләр, татарга дәүләт бирерләр идеме?
- Премьер-министр Һашим Тачи бу атнада Вашингтонга килгәч Косово үз карашында кала, бәйсезлек юлыннан чигенмәячәк, дип белдерде.
- Ул, Идел буе төбәгендә 2 миллионга якын фин-угыр яши, бу форум Русиядәге фин-угыр халыкларының милләтен саклый алуын күрсәтә, диде.
- Без Казанның Камал театрында эшләүче, иҗат итүче яшь драмматурглар белән дә таныштык, сезгә аларның уй-фикерләрен җиткергән идек.
- Әл Бәгъдадия каналының элекке башлыгы исә, Зәйди төрмәдән чыгуга 4 бүлмәле фатир, аңа яңа бер машина, акча һәм сәламәтлек чыгымнары өчен түләргә вәгъдә иткән.
- Башкорт тешли дип без тешләрен коеп,телләрен кисәргә кирәк түгел.
- Чонки башкорт булсан, син бернинди дэ налог тулэмэгэнсен.
- Алдагы көннәрдә һәр татар җәмәгатьчелек оешмасы үзләренең халык исәбен алуга әзерлек барышында башкарачак эш-гамәлләре турында план-программаларын эшләүне тәмамлап, берлектәге фикер алышуга җыела.
- Солженицынны үрнәк итеп Ләкин бу айда Чирикова җитәкләгән хәрәкәт хәлнең катлаулана баруын сизә, чөнки урманны кисүгә ныклап тотыналар.
- İr belän xatınnıñ bergä uramğa çığuı – gönah.
Miscellaneous
Example sentences have been downloaded from http://corpora.uni-leipzig.de/downloads/bak_newscrawl_2011_100K-text.tar.gz
Symbol meanings:
Hint: Hover over a character to see its unicode name.