テキストを難読化
テキストを難読化
Unicode文字で自動検閲を回避する
最新の開発状況
トランプ政権は数百もの用語を禁止リストに載せました。当社のツールは、文字を自動的に類似したUnicode文字に置き換えるため、「多様性」や「LGBTQ」などの用語は人間には読めるものの、検閲システムには認識されません。
仕組み
このツールは高度なUnicode置換を使用して、250以上の重要な用語を保護します。各文字は視覚的に類似したUnicode文字に置き換えられます。たとえば、「a」は「α」または「а」になります。テキストは人間には読める状態を維持しつつ、自動検閲システムを回避します。
お客様のデータは安全かつ機密に取り扱われます。テキストは処理後すぐに削除されます。
詳細情報
ある 最近のニューヨーク・タイムズの調査 政府のウェブサイトでの削除または使用制限の対象となる数百の単語を記録しました。多様性、公平性、インクルージョン、ジェンダーアイデンティティ、気候変動に関連する多くの用語が、公式のコミュニケーションから姿を消しています。
このツールは、フィルタリングまたは検閲される可能性のある単語を変換するのに役立ち、メッセージを共有しながら自動検出を回避できます。このツールは最近の開発の前に開発しましたが、言語の制限がますます厳しくなるにつれて、ますます関連性が高まっています。
フィルタリングされた単語の例:
diversityequityinclusiongenderLGBTQclimateraceracismtransgenderDEI
Quelle: The New York Times
このツールの仕組み
当社のツールは、高度な文字変換を使用して、テキスト検閲を回避しながら、メッセージを読みやすい状態に保ちます。
1
文字置換
通常の文字を、フィルタに認識されない類似の Unicode 代替文字に置き換えます。
2
不可視文字
ゼロ幅スペースやその他の不可視文字を挿入し、パターン認識を中断します。
3
ワード分割
インテリジェントなワード分割技術は、対象の単語を分割し、人間が読める状態を維持します。