忍者ブログ

Information

javascriptその他いろいろで何か作ってます。

文字列逆転器ユニコード版更新

文字列逆転器ユニコード版を更新しました。
ライブラリを自作しました。
拡張書記素クラスタはUnicode12.0.0準拠です。 regGraphemeCluster.js 16.98kiB
ハングルのデータをスクリプトで生成するようにしたらファイルサイズがかなり小さくなりました。
split-graphemesのコードを組み込んだのでインド・東南アジアの文字を正しく分割出来るようになったはず。
読めないのでよくわかりませんが。

書記素クラスタについて調べたらUnicode.orgのText Segmentationに拡張書記素クラスタの正規表現が載っていたので数日前からちまちまと作業していました。
Unicode.orgからダウンロードしたプロパティデータと拡張書記素クラスタの正規表現を正規表現で整形してスクリプトを組み立てるという正規表現漬けの日々でした。
そんな中、android版WaterFoxのjavascriptの正規表現で\p❴❵が使えないことが判明。
更にモジュールも使えないことが判明。
…まあ使わないんですが。
文字列結合で配列.joinメソッドより+を使ったほうが速いというのをほぼ出来上がってから知ってしまい(´Д`)マジカヨとなりました。
PR

コメント

カテゴリー

P R