PHP | ウダ2Blog

Tagged ‘PHP’

PDFからコピペした文字が微妙に変になったら

PDF内のテキストをコピペすると一部の漢字が「⾯」のように少し小さくひしゃげてしまう事がある。
これは康熙部首やCJK部首補助という本来は部首を示す漢字に誤変換（？）されるらしい。
過去に書いたUTF-8-MAC（NFD）の問題も含めて対策した日本語をノーマライズするライブラリを作ってみました。
https://github.com/uda2/jpnormalizer

(さらに…)

2025/11/13 | Tags: Github, JavaScript, PHP | 制作日記 | コメントください »

URLエンコードはその名の通りURLに使えない文字をエスケープする記述ですが言語や関数によって若干ぶれがあるのですが実際に比較検証した事がなかったのでやってみました。
まずURLはURL Standardに定義されていて
PHPの世界ではurlencode()とrawurlencode()があってurlencode()は半角スペースを「+」に変換したり「~」も変換したりします。
Pythonはurllib.parse.quote()とurllib.parse.quote_plus()があってurllib.parse.quote_plus()は半角スペースを「+」に変換したり「/」も変換したりします。
JavaScriptはencodeURI()とencodeURIComponent()があってencodeURIComponentはURI予約語「#$&+,/:;=?@」も変換するという違いがあります。

(さらに…)

2024/04/15 | Tags: JavaScript, PHP, Python | 制作日記 | コメントください »

Dropboxを使ったメモ系WEBアプリ「memotion」

去年ぐらいから意識高い系の人に人気が出てるNotionとか言うメモサービス（最近Notion AIでも話題になってますね）がありますが、おじさんには手元にファイルが無いメモサービスはなじめず、ずっとDropboxにぐだぐだなフォルダ管理で普通にメモをテキスト保存しておりました。
Notionの特徴的な自由でリッチなドキュメント制作は欲してなかったのですがタグ管理できるのが羨ましく思い、Dropboxでもいい感じにタグ管理できるWEBアプリを作りました。

https://tenhp.com/memotion/

(さらに…)

2023/04/24 | Tags: API, Dropbox, PHP | 制作日記 | コメントください »

FILTER_SANITIZE_STRINGはダメです。

PHP8.1になってから「FILTER_SANITIZE_STRING」は非推奨になりました。

「FILTER_SANITIZE_STRING」はfilter_inputやfilter_varで利用するフィルターの一つです。
特に「FILTER_SANITIZE_STRING」を多様してた訳では何ですがその名前から「文字を無害化」するというイメージで簡易的に処理したいときには使っていました。
非推奨の知らせを受けて改めて調べてみました。

(さらに…)

2022/07/23 | Tags: PHP | 制作日記 | コメントください »

文字コードで気をつけること

よく「JIS（ISO-2022-JP）」と表現されますが、PHPでは「ISO-2022-JP」と「JIS」は違う文字コードになります。
「ISO-2022-JP」はメールでよく使われる文字コードで規格を厳守してるので機種依存文字（ISO-2022-JP規定外文字）や半角カナ共に扱えません。
一方「JIS」は半角カナが使え、機種依存文字が扱えない。
八方ふさがりのように見えるがPHP5.2.1からは「ISO-2022-JP-MS」が用意されており、コレだと機種依存文字も半角カナも扱える。
「メールはJISだから機種依存文字や半角カナが送信出来ない」はずだが、ISO-2022-JPのふりして中身をISO-2022-JP-MSにすると機種依存文字が送れたりします。（受け手のメールソフトが対応してた場合のみですが・・・）
(さらに…)

2015/05/06 | Tags: PHP, SJIS, UTF-8, 文字コード | 制作日記 | コメントください »

simplexml_load_fileとsimplexml_load_stringの速度比較

外部サイトのRSSを読む処理をする際に専用の関数simplexml_load_fileを使っていた。
混雑するサイトを考慮してタイムアウト時間、待機時間、再試行回数を含めた関数を作った。
(さらに…)

2015/05/05 | Tags: PHP, ベンチ | 制作日記 | コメントください »

コンストラクタで多言語化を

PHPなどのシステムで多言語に対応する際は出力の度に言語で分岐して出力するより、言語ファイルを用意した方が効率的です。

言語ファイルと言えばプログラム業界では「.po」「.mo」といったファイルがよく見られます。（はてなの場合）
これらの言語ファイルをPHPで使うには下記の流れの作業する事になります。

1. 翻訳元の「.pot」ファイルを作成
2. ファイルを元に翻訳元と翻訳後の書かれた「.po」ファイルを作成
3. 「.po」ファイルを「.mo」ファイルにバイナリ変換
4. GetTextというライブラリで翻訳させる。

大規模なシステムだと分業しやすいというメリットはありますが「TASK4BOX」みたいな規模の小さいシステムだと大袈裟なので自前で言語ファイルを作る事にした。
(さらに…)

2015/05/03 | Tags: PHP, クラス, コンストラクタ, 多言語化 | 制作日記 | コメントください »

iPhoneに元号アイコン

WEBは西暦表記が多いですが書類を書いたりする際には未だ元号（年号）で記入する事が多々あります。
Siriに「今年は平成何年？」と聞いたらも答えてくれますが恥ずかしいです。
IT4コマ漫画：今って平成何年だっけ？ – ITmedia ニュース
によるとそういうアプリがあるとの事ですが年号がバッジ（右上の数字）で表現されていて見た目が微妙です。
そこで、巷にあるアイコンをカスタムするアプリの方法を使って元号の書かれたアイコンを貼れないか試してみた。
(さらに…)