Language pack for தமிழ் (Tamil)
Status: published. This language pack has already been finalized and published.
Character map
The following characters, grouped by Unicode script, are considered for this language pack.
Tamil
ஂ
ஃ
அ
ஆ
இ
ஈ
உ
ஊ
எ
ஏ
ஐ
ஒ
ஓ
ஔ
க
ங
ச
ஜ
ஞ
ட
ண
த
ந
ன
ப
ம
ய
ர
ற
ல
ள
ழ
வ
ஶ
ஷ
ஸ
ஹ
ா
ி
ீ
ு
ூ
ெ
ே
ை
ொ
ோ
ௌ
்
ௐ
ௗ
௦
௧
௨
௩
௪
௫
௬
௭
௮
௯
௰
௱
௲
௳
௴
௵
௶
௷
௸
௹
௺
Common
!
"
#
$
%
&
'
(
)
*
+
,
-
.
/
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
@
^
_
`
{
}
~
¡
¢
£
¤
¥
¦
§
¨
©
«
¬
°
·
»
¼
÷
˜
।
–
—
‘
’
‚
“
”
„
‡
•
…
′
″
‹
€
→
−
Latin
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
ª
Ò
Ô
Õ
Ù
à
è
é
ë
í
ï
ó
ô
õ
ö
ø
ù
ú
û
ü
ý
þ
Œ
œ
Š
ž
ƒ
ḥ
Inherited
Devanagari
ः
अ
ओ
क
ग
ट
त
न
ब
भ
म
य
र
व
ह
ा
ि
ी
्
Unknown
Greek
μ
Language pack rules
Starting with all characters that appear in the example sentences, declare the following characters as:
- important: Tamil (probable)
- supplementary: Tamil (all)
- ignore: Latin (all), Devanagari (all), Greek (all)
Used Huffman trees
- word offsets: 0 1 2 3 4 5 6 7 8 9
- monograms: " ' ( - 1 2 : அ ஆ இ உ எ ஏ ஒ ஓ க ச ஜ ட த ந ப ம ய ர ல வ
- bigrams: 00 01 10 20 அட அண அத அந அன அப அம அர அற அல அள அழ அவ ஆக ஆண ஆன இட இத இந இன இப இர இல இவ உட உண உய உர உற உள எட எத என எல எழ ஏற ஒர கட கண கத கன கப கம கர கல கள கழ கவ கா கி கு கூ கே கை கொ கோ க் ங் சத சந சன சம சர சா சி சு செ சே சை சொ ச் ஞ் டக டங டத டந டன டப டம டர டல டவ டா டி டு டை ட் ணம ணி ணு ணை ண் தக தங தத தன தப தம தர தற தல தவ தா தி தீ து தெ தே தை தொ தோ த் நக நட நம நா நி நீ நே ந் னக னத னம னர னவ னா னி னு னை ன் பக பட பண பத பய பர பற பல பவ பா பி பு பூ பெ பே பை பொ போ ப் மக மட மண மத மன மர மற மல மா மி மீ மு மூ மெ மே மை ம் யக யத யன யப யம யர யல யவ யா யி யு யே யை யோ ய் ரச ரண ரத ரப ரம ரவ ரா ரி ரு ரூ ரே ரை ரோ ர் றத றன றப றவ றா றி று றை ற் லக லத லம லர லவ லா லி லு லே லை ல் ளத ளர ளவ ளா ளி ளு ளை ள் ழக ழி ழு ழை ழ் வக வச வட வத வந வன வம வர வற வல வள வழ வா வி வீ வு வெ வே வை வ் ஸ் ாக ாங ாச ாட ாண ாத ாந ான ாப ாம ாய ார ாற ால ாள ாழ ாவ ி, ிக ிச ிட ித ிந ின ிப ிம ிய ிர ிற ில ிள ிழ ிவ ீட ீத ீர ு, ுக ுச ுட ுண ுத ுந ுன ுப ும ுர ுற ுல ுள ுழ ுவ ூட ூர ூற ூல ெட ெண ென ெய ெர ெற ெல ெள ேச ேட ேண ேன ேர ேற ேல ை, ைக ைச ைத ைந ைப ைய ைவ ொட ொண ொர ொல ொள ொழ ோக ோட ோத ோன ோய ோர ோல ், ்க ்ச ்ட ்ண ்த ்ந ்ன ்ப ்ம ்ய ்ர ்ற ்ல ்ள ்வ ்ஸ
Example sentences
- ஒரு சீனியர் அமைச்சர், "முன்பெல்லாம் அட்டர்னி ஜெனரல் ஒரு விவகாரத்தில் ஆஜராகிறார் என்றாலே, நீதிபதிகள் மத்தியில் ஒரு மரியாதை இருக்கும்.
- எல்லோருக்கும் முதலாக, 'உலகம் சுற்றிய தமிழர்' என்றே அறியப்பட்ட ஏ.கே.செட்டியாரைப் பற்றி.
- பெருந்தெருப்பக்கமிருந்து சைக்கிளில் வந்த ஆளைக் கண்டதும் ஆச்சரியத்திலும் ஆறுதலிலும் தன்னை மறந்து நிற்கச் சொல்லி கை காட்டினான்.
- அவ்வழியாக வரும் சம்பந்தர் இந்தப் பெண்மீது கருணை கொண்டு இறைவனைப் போற்றிப் பாட, வணிகர் உயிர் மீண்டு வருகிறார்.
- இது குறித்து உலக வங்கி வெளியிட்டுள்ள செய்தி:உலக வங்கியின் நிர்வாக குழுக் கூட்டத்தில், இந்தியா உட்பட ஐந்து நாடுகளுக்கு கடன் வழங்க ஒப்புதல் அளிக்கப்பட்டுள்ளது.
- இந்தப் பாசம்தான் ரெண்டு பேரையும் காப்பாத்தியிருக்கு என்கிறார் நவீனின் தாத்தா.
- பொதுப்பணித்துறை அதி காரிகள் மற்றும் ஏரியை கண்காணிக்கும் காவலர்கள் சென்று வருவதற்காக அமைக்கப்பட்ட சாலையின் நிலை இன்று மிக மோசமாக மாறிவிட்டது.
- இதை எனது முதல் பக்கமாக்கு # கட்டுரைகள் # தகவல்கள் # செய்திகள் # கதைகள் # படங்கள் தினமலர் முதல் பக்கம் »காலண்டர் (22-Feb-2013) முதல் பக்க செய்திகள் உலக தமிழர் செய்திகள் → பிறமாநில செய்திகள் → Copyright © 2011 Dinamalar - No :1 Tamil News Website.
- இவர்கள் திருமணம் நாளை காலை சென்னை சாந்தோம் நெடுஞ்சாலை எம்.
- அது வரை காலமும் இல்லாத வகையில் பாடலுக்கும் இசைக்கும் வழங்கப்பட்ட ஒரு முக்கியத்துவம்.
Miscellaneous
Example sentences have been downloaded from http://corpora.uni-leipzig.de/downloads/tam_newscrawl_2011_100K-text.tar.gz
Symbol meanings:
A
The character has appeared less than 10 times in the example sentences.A
The character has appeared at least 10 times, but was seen very rarely.A
The character has been seen very often.A
The character is included as an important character.A
The character is included as an important character, but there's already a lowercase variant of it.A
The character is included as a supplementary character.A
The character is excluded from the language pack.Hint: Hover over a character to see its unicode name.