SlideShare une entreprise Scribd logo
1  sur  36
Open-Tamil 
Text Processing Library in Python 
A Muthiah, T Shrinivasan, M Annamalai 
13th Tamil Internet Conference – 2014, Puducherry, India
T Shrinivasan 
tshrinivasan@gmail.com 
GNU/Linux Evangalist 
Editor : http://Kaniyam.com 
Ex-Co-ordinator : http://ilugc.in 
Publisher : http://FreeTamilEbooks.com 
Blogger : http://Goinggnu.wordpress.com 
Coder : http://github.com/tshrinivasan 
Photographer : http://commons.wikimedia.org/wiki/Special:ListFiles/Tshrinivasan
தமிழ் எழுத்துகளைளை 
ைகளயாளுதல்
நிறுவுதல் 
● Python package 
– Python Package installer (pip) 
– https://pypi.python.org/pypi/Open-Tamil/ 
● Git-Hub collaboration 
– Open-Tamil core repo 
https://github.com/arcturusannamalai/open-tamil/ 
● Social blogs 
– http://ezhillang.wordpress.com/
உயிரெரெழுத்துக்களள
எழுத்துக்களைளைக் களண்டறிதல் 
• Tamil Letters 
• Vowels 
• Consonants
வார்த்ைதகளளின் நீளைம் களாணுதல்
வைகளப்படுத்துதல்
வார்த்தைதைகளின் பயன்பாட
உரைர - IPA
உரைர - IPA
எழுத்ததுரு மாற்றம
எழுத்ததுரு மாற்ற வைககள 
13. Tam 
14. Tscii 
15. Pallavar 
16. Indoweb 
17. Koeln 
18. Libi 
19. Oldvikatan 
20. Webulagam 
21. Diacritic 
22. Shreelipi 
23. Softview 
24. Tace 
25. Vanavil 
1. Anjal 
2. Bamini 
3. Boomi 
4. Dinakaran 
5. Dinamani 
6. Dinathanthy 
7. Kavipriya 
8. Murasoli 
9. Mylai 
10. Nakkeeran 
11. Roman 
12. Tab
ஒருங்குறி மாற்றம
ngram
ஒலிபெபயர்ப்ப
வார்த்தைதைகைளை 
திருப்பதைல
தமிழ99 தட்டச்சுப் பலகைக 
➔ JQuery 
➔ JQuery UI based 
➔ Free to use on web 
➔ e.g. Www.Urbantamil.com
கட்டற்ற/திறவூற்று 
ெமென்பெபொருள 
➔ Multi-licensed 
➔ MIT, and other OSS 
➔ Multi-language 
➔ C, Python, JavaScript, C 
➔ 
Source : https://github.com/arcturusannamalai/open-tamil
பயன்பபொட 
1.Websites: 
1.Ezhil Language 
2.UrbanTamil 
2.Installs on Python 
1.1000+ downloads on PIP
பங்களிப்ோபொர 
முத்து & சீன 
ezhillang@gmail.com & tshrinivasan@gmail.com 
அருளொளன்ப சத்யொ 
msathia@gmail.com arulalant@gmail.com
உதொரணங்கள
எழுத்துக்கைள எண்ணுதல
Transliterate
வொரத்ைதகைள திருப்புதல
எழுத்துகளொகப் பிரித்தல
வார்த்தைதைகளாகப் பிரித்ததைல
எழுத்தது இடத்தைதைக் கண்டுபிடித்ததைல
திஸ்கி - ஒருங்குறி மாற்றம
ஒருங்குறி - திஸ்கி மாற்றம
உரைரை - IPA
Questions
Thanks
கிரிேயேடிவ் காமன்ஸ் படங்கள் மூலம 
● http://upload.wikimedia.org/wikipedia/commons/d/d1/Tamil-Encoding-UnicodePUA-TACE16-● http://pixabay.com/p-2261 
● http://upload.wikimedia.org/wikibooks/ta/c/c8/Tamil_vwl.gif 
● http://upload.wikimedia.org/wikibooks/ta/f/f8/Tamil_cons.gif 
● http://upload.wikimedia.org/wikipedia/commons/a/ae/Metal_movable_type.jpg 
● http://kamalasurabhi.org/basic_lessons/ipa_tamil.gif 
● http://en.wikipedia.org/wiki/Tamil_script 
● https://books.google.com/ngrams/graph?content=tamil&year_start=1900&year_end=● http://www.tamildictionary.org/tamil_transliteration.php 
● http://blog.ravidreams.net/wp-content/uploads/2006/12/tamil99.jpg 
● http://commons.wikimedia.org/wiki/File:Nandri_%28%E0%AE%A8%E0%AE%A9%E0%● http://about.me/SathiaNMahadevan 
● http://pixabay.com/p-96286
Creative Commons Attribution Share-Alike 
License

Contenu connexe

Tendances (20)

Pseudo code
Pseudo codePseudo code
Pseudo code
 
Chapter 2.datatypes and operators
Chapter 2.datatypes and operatorsChapter 2.datatypes and operators
Chapter 2.datatypes and operators
 
Control structure C++
Control structure C++Control structure C++
Control structure C++
 
Data types in python
Data types in pythonData types in python
Data types in python
 
Introduction to Html
Introduction to HtmlIntroduction to Html
Introduction to Html
 
Manipulators in c++
Manipulators in c++Manipulators in c++
Manipulators in c++
 
Fundamentals of Python Programming
Fundamentals of Python ProgrammingFundamentals of Python Programming
Fundamentals of Python Programming
 
Python tutorial
Python tutorialPython tutorial
Python tutorial
 
SPL 9 | Scope of Variables in C
SPL 9 | Scope of Variables in CSPL 9 | Scope of Variables in C
SPL 9 | Scope of Variables in C
 
Function overloading ppt
Function overloading pptFunction overloading ppt
Function overloading ppt
 
Python Sequence Data types in Brief
Python Sequence Data types in BriefPython Sequence Data types in Brief
Python Sequence Data types in Brief
 
List in Python
List in PythonList in Python
List in Python
 
Structure in C
Structure in CStructure in C
Structure in C
 
Modular Programming in C
Modular Programming in CModular Programming in C
Modular Programming in C
 
Storage class in c
Storage class in cStorage class in c
Storage class in c
 
Networking concepts
Networking conceptsNetworking concepts
Networking concepts
 
Introduction to algorithms
Introduction to algorithmsIntroduction to algorithms
Introduction to algorithms
 
Operator overloading
Operator overloadingOperator overloading
Operator overloading
 
Python Book/Notes For Python Book/Notes For S.Y.B.Sc. I.T.
Python Book/Notes For Python Book/Notes For S.Y.B.Sc. I.T.Python Book/Notes For Python Book/Notes For S.Y.B.Sc. I.T.
Python Book/Notes For Python Book/Notes For S.Y.B.Sc. I.T.
 
Tuple in python
Tuple in pythonTuple in python
Tuple in python
 

En vedette

ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamilஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in TamilShrinivasan T
 
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Shrinivasan T
 
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் Shrinivasan T
 
இணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetஇணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetmedwaytamilsangam
 
சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்Rasmi Rajesh
 

En vedette (8)

ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamilஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
 
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
 
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
 
இணையம்
இணையம்இணையம்
இணையம்
 
இணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetஇணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internet
 
சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்
 
Love,Love Love
Love,Love LoveLove,Love Love
Love,Love Love
 
Tamil book
Tamil bookTamil book
Tamil book
 

Plus de Shrinivasan T

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationShrinivasan T
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfShrinivasan T
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introductionShrinivasan T
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with pythonShrinivasan T
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionShrinivasan T
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Shrinivasan T
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Shrinivasan T
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...Shrinivasan T
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipediaShrinivasan T
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systemsShrinivasan T
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntuShrinivasan T
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of EngineeringShrinivasan T
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01Shrinivasan T
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User GroupShrinivasan T
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An IntroductionShrinivasan T
 

Plus de Shrinivasan T (20)

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through Digitization
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdf
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introduction
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with python
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correction
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipedia
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systems
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntu
 
Dhvani TTS
Dhvani TTSDhvani TTS
Dhvani TTS
 
Freedom toaster
Freedom toasterFreedom toaster
Freedom toaster
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of Engineering
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01
 
Rpm Introduction
Rpm IntroductionRpm Introduction
Rpm Introduction
 
Foss History
Foss HistoryFoss History
Foss History
 
Jobs In Foss
Jobs In FossJobs In Foss
Jobs In Foss
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User Group
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An Introduction
 

Open-Tamil Python Library for Tamil Text Processing