SlideShare une entreprise Scribd logo
1  sur  36
Open-Tamil 
Text Processing Library in Python 
A Muthiah, T Shrinivasan, M Annamalai 
13th Tamil Internet Conference – 2014, Puducherry, India
T Shrinivasan 
tshrinivasan@gmail.com 
GNU/Linux Evangalist 
Editor : http://Kaniyam.com 
Ex-Co-ordinator : http://ilugc.in 
Publisher : http://FreeTamilEbooks.com 
Blogger : http://Goinggnu.wordpress.com 
Coder : http://github.com/tshrinivasan 
Photographer : http://commons.wikimedia.org/wiki/Special:ListFiles/Tshrinivasan
தமிழ் எழுத்துகளைளை 
ைகளயாளுதல்
நிறுவுதல் 
● Python package 
– Python Package installer (pip) 
– https://pypi.python.org/pypi/Open-Tamil/ 
● Git-Hub collaboration 
– Open-Tamil core repo 
https://github.com/arcturusannamalai/open-tamil/ 
● Social blogs 
– http://ezhillang.wordpress.com/
உயிரெரெழுத்துக்களள
எழுத்துக்களைளைக் களண்டறிதல் 
• Tamil Letters 
• Vowels 
• Consonants
வார்த்ைதகளளின் நீளைம் களாணுதல்
வைகளப்படுத்துதல்
வார்த்தைதைகளின் பயன்பாட
உரைர - IPA
உரைர - IPA
எழுத்ததுரு மாற்றம
எழுத்ததுரு மாற்ற வைககள 
13. Tam 
14. Tscii 
15. Pallavar 
16. Indoweb 
17. Koeln 
18. Libi 
19. Oldvikatan 
20. Webulagam 
21. Diacritic 
22. Shreelipi 
23. Softview 
24. Tace 
25. Vanavil 
1. Anjal 
2. Bamini 
3. Boomi 
4. Dinakaran 
5. Dinamani 
6. Dinathanthy 
7. Kavipriya 
8. Murasoli 
9. Mylai 
10. Nakkeeran 
11. Roman 
12. Tab
ஒருங்குறி மாற்றம
ngram
ஒலிபெபயர்ப்ப
வார்த்தைதைகைளை 
திருப்பதைல
தமிழ99 தட்டச்சுப் பலகைக 
➔ JQuery 
➔ JQuery UI based 
➔ Free to use on web 
➔ e.g. Www.Urbantamil.com
கட்டற்ற/திறவூற்று 
ெமென்பெபொருள 
➔ Multi-licensed 
➔ MIT, and other OSS 
➔ Multi-language 
➔ C, Python, JavaScript, C 
➔ 
Source : https://github.com/arcturusannamalai/open-tamil
பயன்பபொட 
1.Websites: 
1.Ezhil Language 
2.UrbanTamil 
2.Installs on Python 
1.1000+ downloads on PIP
பங்களிப்ோபொர 
முத்து & சீன 
ezhillang@gmail.com & tshrinivasan@gmail.com 
அருளொளன்ப சத்யொ 
msathia@gmail.com arulalant@gmail.com
உதொரணங்கள
எழுத்துக்கைள எண்ணுதல
Transliterate
வொரத்ைதகைள திருப்புதல
எழுத்துகளொகப் பிரித்தல
வார்த்தைதைகளாகப் பிரித்ததைல
எழுத்தது இடத்தைதைக் கண்டுபிடித்ததைல
திஸ்கி - ஒருங்குறி மாற்றம
ஒருங்குறி - திஸ்கி மாற்றம
உரைரை - IPA
Questions
Thanks
கிரிேயேடிவ் காமன்ஸ் படங்கள் மூலம 
● http://upload.wikimedia.org/wikipedia/commons/d/d1/Tamil-Encoding-UnicodePUA-TACE16-● http://pixabay.com/p-2261 
● http://upload.wikimedia.org/wikibooks/ta/c/c8/Tamil_vwl.gif 
● http://upload.wikimedia.org/wikibooks/ta/f/f8/Tamil_cons.gif 
● http://upload.wikimedia.org/wikipedia/commons/a/ae/Metal_movable_type.jpg 
● http://kamalasurabhi.org/basic_lessons/ipa_tamil.gif 
● http://en.wikipedia.org/wiki/Tamil_script 
● https://books.google.com/ngrams/graph?content=tamil&year_start=1900&year_end=● http://www.tamildictionary.org/tamil_transliteration.php 
● http://blog.ravidreams.net/wp-content/uploads/2006/12/tamil99.jpg 
● http://commons.wikimedia.org/wiki/File:Nandri_%28%E0%AE%A8%E0%AE%A9%E0%● http://about.me/SathiaNMahadevan 
● http://pixabay.com/p-96286
Creative Commons Attribution Share-Alike 
License

Contenu connexe

Tendances

Introduction to K6
Introduction to K6Introduction to K6
Introduction to K6Knoldus Inc.
 
Puppeteer - A web scraping & UI Testing Tool
Puppeteer - A web scraping & UI Testing ToolPuppeteer - A web scraping & UI Testing Tool
Puppeteer - A web scraping & UI Testing ToolMiki Lombardi
 
Unit Testing vs Integration Testing
Unit Testing vs Integration TestingUnit Testing vs Integration Testing
Unit Testing vs Integration TestingRock Interview
 
Testing concepts [3] - Software Testing Techniques (CIS640)
Testing concepts [3] - Software Testing Techniques (CIS640)Testing concepts [3] - Software Testing Techniques (CIS640)
Testing concepts [3] - Software Testing Techniques (CIS640)Venkatesh Prasad Ranganath
 
Rust system programming language
Rust system programming languageRust system programming language
Rust system programming languagerobin_sy
 
Automated Mobile Testing using Appium.pdf
Automated Mobile Testing using Appium.pdfAutomated Mobile Testing using Appium.pdf
Automated Mobile Testing using Appium.pdfAnand722237
 
Puppeteer - Headless Chrome Node API
Puppeteer - Headless Chrome Node APIPuppeteer - Headless Chrome Node API
Puppeteer - Headless Chrome Node APIubunturk
 
Golang 101
Golang 101Golang 101
Golang 101宇 傅
 
Software testing lecture 9
Software testing lecture 9Software testing lecture 9
Software testing lecture 9Abdul Basit
 
Elixir and elm
Elixir and elmElixir and elm
Elixir and elmMix & Go
 
OReilly-Web-Application-Security-NGINX.pdf
OReilly-Web-Application-Security-NGINX.pdfOReilly-Web-Application-Security-NGINX.pdf
OReilly-Web-Application-Security-NGINX.pdfRazaMehmood7
 
Window Desktop Application Testing
Window Desktop Application TestingWindow Desktop Application Testing
Window Desktop Application TestingTrupti Jethva
 
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 Edition
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 EditionGoing Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 Edition
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 EditionSoroush Dalili
 

Tendances (20)

Introduction to K6
Introduction to K6Introduction to K6
Introduction to K6
 
Selenium-Locators
Selenium-LocatorsSelenium-Locators
Selenium-Locators
 
Puppeteer - A web scraping & UI Testing Tool
Puppeteer - A web scraping & UI Testing ToolPuppeteer - A web scraping & UI Testing Tool
Puppeteer - A web scraping & UI Testing Tool
 
Unit Testing vs Integration Testing
Unit Testing vs Integration TestingUnit Testing vs Integration Testing
Unit Testing vs Integration Testing
 
Testing concepts [3] - Software Testing Techniques (CIS640)
Testing concepts [3] - Software Testing Techniques (CIS640)Testing concepts [3] - Software Testing Techniques (CIS640)
Testing concepts [3] - Software Testing Techniques (CIS640)
 
Rust system programming language
Rust system programming languageRust system programming language
Rust system programming language
 
Automated Mobile Testing using Appium.pdf
Automated Mobile Testing using Appium.pdfAutomated Mobile Testing using Appium.pdf
Automated Mobile Testing using Appium.pdf
 
Rust-lang
Rust-langRust-lang
Rust-lang
 
Puppeteer - Headless Chrome Node API
Puppeteer - Headless Chrome Node APIPuppeteer - Headless Chrome Node API
Puppeteer - Headless Chrome Node API
 
Golang 101
Golang 101Golang 101
Golang 101
 
Software testing lecture 9
Software testing lecture 9Software testing lecture 9
Software testing lecture 9
 
Clean code
Clean code Clean code
Clean code
 
Oracle APEX Nitro
Oracle APEX NitroOracle APEX Nitro
Oracle APEX Nitro
 
Elixir and elm
Elixir and elmElixir and elm
Elixir and elm
 
OReilly-Web-Application-Security-NGINX.pdf
OReilly-Web-Application-Security-NGINX.pdfOReilly-Web-Application-Security-NGINX.pdf
OReilly-Web-Application-Security-NGINX.pdf
 
Window Desktop Application Testing
Window Desktop Application TestingWindow Desktop Application Testing
Window Desktop Application Testing
 
TypeScript Overview
TypeScript OverviewTypeScript Overview
TypeScript Overview
 
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 Edition
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 EditionGoing Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 Edition
Going Beyond Microsoft IIS Short File Name Disclosure - NahamCon 2023 Edition
 
Code smells and remedies
Code smells and remediesCode smells and remedies
Code smells and remedies
 
Performance testing locust
Performance testing   locustPerformance testing   locust
Performance testing locust
 

En vedette

ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamilஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in TamilShrinivasan T
 
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Shrinivasan T
 
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் Shrinivasan T
 
இணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetஇணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetmedwaytamilsangam
 
சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்Rasmi Rajesh
 

En vedette (8)

ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamilஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
ஏன் லினக்ஸ் பயன்படுத்த வேண்டும்? - Why Linux? in Tamil
 
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
Contribute to free open source software tamil - கட்டற்ற மென்பொருளுக்கு பங்களி...
 
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும் கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
கணித்தமிழும் மென்பொருள்களும் - தேவைகளும் தீர்வுகளும்
 
இணையம்
இணையம்இணையம்
இணையம்
 
இணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internetஇணயத்தில் தமிழ் Tamil usage in internet
இணயத்தில் தமிழ் Tamil usage in internet
 
சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்சில பயனுள்ள இனையத்தளங்கள்
சில பயனுள்ள இனையத்தளங்கள்
 
Love,Love Love
Love,Love LoveLove,Love Love
Love,Love Love
 
Tamil book
Tamil bookTamil book
Tamil book
 

Plus de Shrinivasan T

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationShrinivasan T
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfShrinivasan T
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introductionShrinivasan T
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with pythonShrinivasan T
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionShrinivasan T
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Shrinivasan T
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Shrinivasan T
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...Shrinivasan T
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipediaShrinivasan T
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systemsShrinivasan T
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntuShrinivasan T
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of EngineeringShrinivasan T
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01Shrinivasan T
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User GroupShrinivasan T
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An IntroductionShrinivasan T
 

Plus de Shrinivasan T (20)

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through Digitization
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdf
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introduction
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with python
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correction
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipedia
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systems
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntu
 
Dhvani TTS
Dhvani TTSDhvani TTS
Dhvani TTS
 
Freedom toaster
Freedom toasterFreedom toaster
Freedom toaster
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of Engineering
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01
 
Rpm Introduction
Rpm IntroductionRpm Introduction
Rpm Introduction
 
Foss History
Foss HistoryFoss History
Foss History
 
Jobs In Foss
Jobs In FossJobs In Foss
Jobs In Foss
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User Group
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An Introduction
 

Open-Tamil Python Library for Tamil Text Processing