外部データ読み込み時に起こる、マルチ文字エラーの対処

備忘録。

エクセルで作成したcsvファイルを統計ソフトRで読み込む際に、「不正なマルチバイト文字があります」と出ることがあります。他のケースはわかりませんが、僕の今回のケースはテキストのエンコーディングが原因だったようです。excel for Mac 2008 でcsvファイルを作成すると、どうやらShift_JIS形式で保存されるようで、これがRでデータを取り込もうとする際にネックとなっているようでした。

対処法は以下のように行いました。まず、一度エクセルでcsvファイルを作成したあと、そのファイルをテキストエディタで開きます。僕はmiを使用しましたが、エンコーディング形式を変換できればなんでも良いと思われます。そして、エンコーディング形式をUTF-8に変換して保存し直しました。その後、Rに取り込むのに、read.csv()コマンドを入力すると無事取り込まれました。

久しぶりのRですが、まだ問題を抱えているので今日は長い夜になりそうです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です