データ操作– category –
Dataの入手から加工までお役立ちノウハウをご紹介します。
-
Pythonの画像類似度判定で同一画像や近い画像を検知する
目視チェックが大変な画像をPythonを利用して、同一画像や類似画像を検索する方法のご紹介です。 画像類似度の抽出方法がわかれば、似たような画像をグループとしてまとめる方法も可能です。参考に階層指定クラスタリングのPythonコード紹介と活用例の記事... -
グループの名称から区切り文字で同一キーワードをPytyhonで抽出
カテゴリ毎に名称があるリストで、同一名称を抜き出したいニーズがあります。例えば、カテゴリと名称の組み合わせがあるデータ(左図)を元に、categolyをkeyにnameと同じ名称を抽出しました(右図) 元データ categolyname12tsutech プログラム講座 les... -
PythontやSQL学習で利用するサンプルデータの提供
Python学習を効率的に進めるためにサンプルデータをご用意いたしました。個人で利用する分には問題ありませんが、WebサイトやSNSなど、第3者への掲載および提供はしないようお願いいたします。 ■商品情報ファイル1下記の商品情報ファイル約100レコードの... -
Pythonで距離計算!レーベンシュタインでテキスト類似度判定
レーベンシュタイン距離というアルゴリズムを利用すると、2文章間の距離がどのくらい離れているか算出でき、テキスト類似度判定に使えます。 テキストの類似度判定手法は自然言語解析後のコサイン類似度などいくつかの方法がありますが、使い方によっては... -
SQLで複数条件抽出!AND,OR併用パターンとNULL対応
複数条件でのSQLデータ抽出に戸惑う方は多いと思います。大きなくくりではAND,ORを使う方法とIN句を利用する方法があります。単純に複数条件を記載する方法がわからない方から優先順位の決め方やnot,nullなどの条件が出た場合に、目的のデータを抽出するた... -
大量PowerPointの指定個所に画像をPythonで自動挿入
Microsoft提供のPowerPointはプレゼンテーションソフトですので、自動化のイメージがつかない人がほとんどだと思いますし、ニーズもほとんどありません。 セキュリティの観点で、作成してきたPowerPointにロゴや注意事項を必ず入れなければならなくなった... -
PythonでExcelファイルにパスワード設定する方法
企業毎に中身が違うExcelファイルを100社にメール送信するとします。情報漏洩リスク回避のため、Excelに企業毎のパスワードを手動でかけることは付加価値を産まないので、自動化の検討候補になります。 ファイルにパスワードを付ける方法としていくつか選... -
PythonスクリプトをPyinstallerで軽量exe化
Pythonで作成した自動処理をexe化(エグゼ)すると、どのパソコンでも同じ自動処理を実現できます。exe内にPython環境が含まれているので、Python環境がない他のPCでも同じ処理が動きます。※Windows環境 例えば、誰かがMicrosoftオフィスのExcelでVBAやマ... -
Webサイトのデータ取得技術!クローリングとスクレイピング
Webサイトにある膨大なデータをプログラムで取得する技術があります。PythonやRubyを利用すると比較的簡単にサイト情報を自動的に取得できます。 データ取得後の使い道は分析やレコメンドなど様々ですが、データ分析すると思わぬ発見があります。例えば、1... -
PythonからAccessのマクロ自動操作で業務DX促進
ExcelやAccessのマクロ機能を実行し、処理を自動化するケースがあります。ただ、毎回誰かが手動でボタンを押すのはスマートではありません。人がいなくても自動的に処理を回せるようにしていくことが人手不足の今求められています。 よくある方法でタスク...