Skip to content

whym/ligtran

Repository files navigation

ligtran

文字と文字をくっつけたり离隹したりすることでテキストを短くしたり長くするウェブサービス

Homepage

http://ligtran.appspot.com

Contact

https://twitter.com/whym

このウェブサイトについて

これは文字と文字をくっつけたり離したりすることで、テキストを短くしたり長くするウェブサービスです。 たとえば 「バイドゥ株式会社」を長く すると「バイドゥ木朱式会ネ土」などとなります。

使い方は下記のとおりです。

  1. 「短く」か「長く」を選びます。
  2. 一つ目の入力欄にテキストを入力します。
  3. 二つ目の欄に変換された結果が表示されます。

変換の方法としては、標準的な合字の組(1,2)と、その他の見た目に類似性のある文字列の組(3)とを用いています。

API

JSON形式でのAPIもあります。

http://ligtran.appspot.com/ligature?q=fi を要求すると、 :

{"result": "\uFB01"}

(fi (U+FB01)__)がかえってきます。

__ http://www.fileformat.info/info/unicode/char/fb01/index.htm

http://ligtran.appspot.com/ligature/reverse?q=%E8%A8%88 (計)を要求すると、 :

{"result": "\u8A00\u5341"}

(言十)がかえってきます。

How to build

※ 主に自分用の備忘録目的なので、やや省略して書いています。

Maven を使うやり方と Ant+Ivy を使うやり方とがあります。

Maven

  1. src/main/resources/ligatures.txt を作ります(chise_to_ligatures.rb)
  2. mvn package
  3. target/ligtran-/ と target/ligtran-.war ができ、これを servelet が動く場所に置けば動きます。

Ant+Ivy

  1. src/main/resources/ligatures.txt を作ります(chise_to_ligatures.rb)
  2. Apache Ivy をインストールし、CLASSPATH を通します。
  3. ant test && ant war
  4. war ディレクトリができ、これを servelet が動く場所に置けば動きます。

Credits

Logo:

The Twitter Logo Generator http://www.twitlogo.com/ligtran/90/33CCFF/FFFFFF/

Icons:

Ajax loading animated gif by Sanbaldo http://www.sanbaldo.com/wordpress/1/ajax_gif/


  1. Unicode Normalization Forms

  2. 漢字構造情報データベース, fonts.jp 漢字分解器

  3. 見た目の類似性による組は 不自然言語処理コンテスト 応募時点では未実装

About

text conversion by composing & decomposing ligatures

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published