Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add IO#set_encoding_by_bom since 2.7.0 #2275

Merged
merged 1 commit into from
May 26, 2020

Conversation

pocke
Copy link
Member

@pocke pocke commented May 26, 2020

#2071

Ruby 2.7 で追加された IO#set_encoding_by_bom のドキュメントを追加します。

RDoc: https://docs.ruby-lang.org/en/2.7.0/IO.html#method-i-set_encoding_by_bom

サンプルコードはRDocのものをベースに、FIle.openにブロックを渡す形にしたり、読み込んだ文字列のencodingを明示したりしています。

自身が BOM から始まる場合、BOM を読み進めて外部エンコーディングをセットし、セットしたエンコーディングを返します。
BOM が見つからなかった場合は nil を返します。

自身がバイナリモードでないかすでにエンコーディングがセットされている場合、例外が発生します。
Copy link
Member Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

実際にはArgumentErrorが発生するようですが、RDocの方に例外クラスが明示されていなかったので、るりまでもクラスは書かないようにしています

@znz znz merged commit baf3fc9 into rurema:master May 26, 2020
@znz
Copy link
Member

znz commented May 26, 2020

とりあえず良さそうだったのでマージしてしまいましたが、 UTF-8 以外 (UTF-16?) の例もあると良いかもしれません。

@pocke pocke deleted the IO#set_encoding_by_bom branch May 26, 2020 14:33
@pocke
Copy link
Member Author

pocke commented May 26, 2020

複数のエンコーディングの例があっても大して情報は増えない(BOMとエンコーディングが変わっただけで後は同じ)なので、足さなくていいかなと思っています。

一方、BOMのない非ASCII文字が含まれているテキストに対してset_encoding_by_bomを呼び出す例はあってもよいかなあと、コメントを受けて考えています

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants