<div dir="ltr">What Fred said. I don't know anything about Perl, but my guess is that it's loading all the files as regular old byte streams whereas Ruby is choking on some invalid UTF-8 in your files. If you want to inspect your files for the bad chars, piping them into hexdump -C might yield a few clues (as Fred mentioned, vim won't be of much use here).</div>

<div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Aug 22, 2013 at 4:27 PM, Frederick Cheung <span dir="ltr"><<a href="mailto:frederick.cheung@gmail.com" target="_blank">frederick.cheung@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><br>
On 22 Aug 2013, at 16:21, gvim <<a href="mailto:gvimrc@gmail.com">gvimrc@gmail.com</a>> wrote:<br>
<br>
</div><div class="im">> I'm encountering some UTF-8 errors in Ruby 2.0. When installing gems I often see non-fatal errors relating to conversion of ASCII characters to UTF-8. The following script is designed to search a large Maildir folder for lines beginning with 4 word characters:<br>


><br>
<br>
</div>Are those files guaranteed to contain only valid utf-8 ? If not then if you might be able to get away with opening them as ascii-8bit (assuming that you don't need to work with them in a unicode aware way)<br>
<br>
Fred<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
_______________________________________________<br>
Chat mailing list<br>
<a href="mailto:Chat@lists.lrug.org">Chat@lists.lrug.org</a><br>
<a href="http://lists.lrug.org/listinfo.cgi/chat-lrug.org" target="_blank">http://lists.lrug.org/listinfo.cgi/chat-lrug.org</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr">Ali, <a href="http://happybearsoftware.com" target="_blank">http://happybearsoftware.com</a></div>
</div>