につ– Author –
-
Pythonでcsvやエクセルファイルを分割するプログラム
1つのファイルから目的別の複数ファイルに分割したい。例えば、エクセル1BOOKに10万行データがあって、宛先毎にエクセルファイルを分けたいケースです。宛先件数が多いほど、別BOOKに保存する作業は大変なので、自動化したい作業です。 本記事では、約... -
Pandasのマルチインデックス(マルチカラム)解除方法
Pandasのピボットテーブルなどのデータ加工をするとマルチインデックス(マルチカラム)になる時があります。データ加工難易度を下げるために、マルチインデックスを解除しデータを連結しながら進めていくことが多いと思います。 本記事では、意図せずマル... -
Pythonの画像類似度判定で同一画像や近い画像を検知する
目視チェックが大変な画像をPythonを利用して、同一画像や類似画像を検索する方法のご紹介です。 画像類似度の抽出方法がわかれば、似たような画像をグループとしてまとめる方法も可能です。参考に階層指定クラスタリングのPythonコード紹介と活用例の記事... -
グループの名称から区切り文字で同一キーワードをPytyhonで抽出
カテゴリ毎に名称があるリストで、同一名称を抜き出したいニーズがあります。例えば、カテゴリと名称の組み合わせがあるデータ(左図)を元に、categolyをkeyにnameと同じ名称を抽出しました(右図) 元データ categolyname12tsutech プログラム講座 les... -
PythontやSQL学習で利用するサンプルデータの提供
Python学習を効率的に進めるためにサンプルデータをご用意いたしました。個人で利用する分には問題ありませんが、WebサイトやSNSなど、第3者への掲載および提供はしないようお願いいたします。 ■商品情報ファイル1下記の商品情報ファイル約100レコードの... -
このリンクは未確認です表示の対策!マカフィー申請で安全に変更
Webサイトの検索結果に?が付くサイトがあります。(下図) ?マークにカーソルを合わせると「McAfee」このリンクは未確認です と表示されます。このことからMcAfeeにたいしてアクションすることが必要とわかります。 サイト検索で上位表示されたとしても... -
Pythonで距離計算!レーベンシュタインでテキスト類似度判定
レーベンシュタイン距離というアルゴリズムを利用すると、2文章間の距離がどのくらい離れているか算出でき、テキスト類似度判定に使えます。 テキストの類似度判定手法は自然言語解析後のコサイン類似度などいくつかの方法がありますが、使い方によっては... -
SQLで複数条件抽出!AND,OR併用パターンとNULL対応
複数条件でのSQLデータ抽出に戸惑う方は多いと思います。大きなくくりではAND,ORを使う方法とIN句を利用する方法があります。単純に複数条件を記載する方法がわからない方から優先順位の決め方やnot,nullなどの条件が出た場合に、目的のデータを抽出するた... -
大量PowerPointの指定個所に画像をPythonで自動挿入
Microsoft提供のPowerPointはプレゼンテーションソフトですので、自動化のイメージがつかない人がほとんどだと思いますし、ニーズもほとんどありません。 セキュリティの観点で、作成してきたPowerPointにロゴや注意事項を必ず入れなければならなくなった... -
PythonでExcelファイルにパスワード設定する方法
企業毎に中身が違うExcelファイルを100社にメール送信するとします。情報漏洩リスク回避のため、Excelに企業毎のパスワードを手動でかけることは付加価値を産まないので、自動化の検討候補になります。 ファイルにパスワードを付ける方法としていくつか選...