Language pack for Tiếng Việt (Vietnamese)
Status: rough draft. This draft has been created from example sentences by non-native speakers. Review from native speakers is required to turn this into a draft. Are there characters missing? Are rarely used characters marked as important? Do the example sentences look good? If you are a native speaker, please send your feedback to: info@nhcham.org.
Character map
The following characters, grouped by Unicode script, are considered for this language pack.
Latin
Common
Inherited
Language pack rules
Starting with all characters that appear in the example sentences, declare the following characters as:
- important: Latin (probable)
- supplementary: (none)
- ignore: (none)
Used Huffman trees
- word offsets: 0 1 3 4 5
- monograms: " ( - 1 2 3 4 5 6 a b c d e g h i k l m n p q r s t u v w x y á ô ý ă đ ả ấ ở
- bigrams: -2 00 01 10 19 20 a, ai al am an ao ar au ay ba bi bu bà bá bê bì bó bạ bả bắ bằ bị bố bộ c, ca ch co cu cá cò có cô cù cũ cơ cư cả cấ cầ củ cứ cử da di do du dà dù dư dị dụ dự el em en eo er es g, ga gh gi go gu gà gì gư gầ gọ h, ha he hi ho hu hà há hé hê hì hí hò hó hô hù hú hă hĩ hơ hư hạ hả hấ hầ hẩ hậ hắ hẳ hế hể hệ hỉ hị họ hỏ hố hồ hộ hờ hợ hụ hủ hứ hữ hự i, ia im in iá iê iả iế iề iể iễ iệ iớ iờ iữ kh ki kế kỳ la le li lo lu là lã lê lú lý lư lạ lầ lậ lớ lự m, ma mi mu mà má mì mô mạ mấ mắ mặ mộ mớ mỹ n, na nd ne ng nh ni nà nê nó nă nư nế nộ nữ o, oa on or oà oá oạ oả p, ph qu ra re ri ro ru rá rê rì rư rấ rậ rằ rẻ rị rọ rồ rở sa se si so st su sá sĩ sả sẽ số sứ sử sự t, ta te th ti to tp tr tu tà tá tì tí tô tă tư tạ tấ tậ tế tỉ tố tổ tớ tụ từ tự u, ua un us uy uá uô uả uấ uậ uố uổ uộ va vi và vì vă vấ vẫ vậ về vị vớ vụ vừ xe xu xã y, yê yế yề yể yễ yệ ài àm àn ào àu ày ác ái ám án áo áp át áy ãn ét êm ên êu ìn íc ín òa òn ó, óa ói ón ôi ôn ùn úc ún út ăm ăn đa đi đo đà đá đã đì đó đô đư đạ đả đấ đầ đặ đế đề để đị đố đồ đổ độ đứ ũn ơi ơn ưa ưn ươ ướ ườ ưở ượ ạc ại ạm ạn ạo ạt ải ảm ản ảo ấn ấp ất ấu ấy ầm ần ầu ẩm ẩn ẫn ận ập ật ậu ậy ắc ắn ắt ằn ẳn ặc ặn ặt ến ếp ết ếu ền ều ểm ển ểu ễn ệc ệm ện ệp ệt ệu ỉn ịa ịc ịn ọc ọi ọn ỏi ốc ối ốn ốt ồi ồn ổi ổn ỗi ộc ội ộn ột ớc ới ớn ời ờn ởi ởn ợc ợi ợn ợp ợt ục ụn ủa ức ứn ừa ừn ửa ữa ữn ực
Example sentences
- 1) Nhận thức có thể được xác lập thông qua việc kiểm kê văn hóa của cộng đồng và thông qua giáo dục.
- Hệ thống tên lửa SAMP-T đang trong giai đoạn thử nghiệm và có triển vọng trở thành hệ thống tên lửa phòng không hàng đầu thế giới.
- Với những hình ảnh động, tốc độ cao (chẳng hạn như các trận đấu thể thao) thì các tivi LCD được làm hiện nay thường có hiện tượng “trễ hình” và có vết mờ.
- Lần này như mong muốn: ứng viên được cử làm giám đốc phát triển sản phẩm mới, lương tháng khoảng 1.700 USD/tháng.
- Cộng sản Việt Nam nhiều lần tỏ ý muốn hòa giải hòa hợp với "khúc ruột ngàn dặm".
- Quá trình biến động của tỷ giá thị trường tự do diễn ra song song với sự gia tăng của lãi suất tiền đồng.
- Quyết định này mới ở giai đoạn đầu triển khai thực hiện, cách nghĩ, cách làm của mỗi trường có thể khác nhau.
- Con ngõ chỉ dài hơn 100m, nối từ phố Lê Thanh Nghị đến ngõ 75 đường Giải Phóng này suốt ngày trong cảnh chật chội bởi các hàng quán dịch vụ (ăn uống, photocopy, can in, trông giữ xe..
- Tổng số tiền chi trả bồi thường hơn 13.400 tỉ đồng, kể cả phần đã chi trả hỗ trợ bổ sung chênh lệch vị trí cho 562 hồ sơ.
- Có thể có sự hấp dẫn ở tên tuổi các vị đến giảng như Phạm Văn Đồng, Võ Nguyên Giáp, Tố Hữu… Nhà nghiên cứu Minh Tranh dạy duy vật biện chứng, duy vật lịch sử, bên cạnh có các chuyên gia về kinh tế, chính trị khác.
Miscellaneous
Example sentences have been downloaded from http://corpora.uni-leipzig.de/downloads/vie_newscrwal_2011_100K-text.tar.gz
Symbol meanings:
Hint: Hover over a character to see its unicode name.