忍者ブログ

Information

javascriptその他いろいろで何か作ってます。

文字列逆転器ユニコード版更新

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

文字列逆転器ユニコード版更新

文字列逆転器ユニコード版を更新しました。
ライブラリを自作しました。
拡張書記素クラスタはUnicode12.0.0準拠です。 regGraphemeCluster.js 16.98kiB
ハングルのデータをスクリプトで生成するようにしたらファイルサイズがかなり小さくなりました。
split-graphemesのコードを組み込んだのでインド・東南アジアの文字を正しく分割出来るようになったはず。
読めないのでよくわかりませんが。

書記素クラスタについて調べたらUnicode.orgのText Segmentationに拡張書記素クラスタの正規表現が載っていたので数日前からちまちまと作業していました。
Unicode.orgからダウンロードしたプロパティデータと拡張書記素クラスタの正規表現を正規表現で整形してスクリプトを組み立てるという正規表現漬けの日々でした。
そんな中、android版WaterFoxのjavascriptの正規表現で\p❴❵が使えないことが判明。
更にモジュールも使えないことが判明。
…まあ使わないんですが。
文字列結合で配列.joinメソッドより+を使ったほうが速いというのをほぼ出来上がってから知ってしまい(´Д`)マジカヨとなりました。
PR

コメント

カテゴリー

P R