- 1. Pythonスクリプトのメモリリークを探す
- 2. 【Python】話題の音声認識ツールキット Vosk を試してみた
- 3. Pythonの勉強方法(初心者)
- 4. 【Python】特定ユーザーの最新の投稿にいいねしたアカウントを全件取得する
- 5. python if文の条件の判定順
- 6. 重回帰分析にダミー変数を使うとき
- 7. C1802:use-implicit-booleaness-not-lenと怒られた反省
- 8. Python学習まとめ
- 9. A simple script to show Airflow 1.10.9 tasks states in non-GUI environments
- 10. Heroku利用方法[Windows]
- 11. opencv-pythonインストール時に ModuleNotFoundError: No module named ‘skbuild’と言われる
- 12. albumentationsのpipインストール時に生じたopencv-python-headless buildエラーの解消法
- 13. Python リストをなるべく均等にN分割する
- 14. Pythonを使ってミュージックアプリを操作する
- 15. 【AtCoder解説】PythonでABC251のA,B,C,D,E問題を制する!
- 16. beautifulsoupで[特定の親要素]配下の[特定の子要素]だけを取得する方法
- 17. Ubntu16.04.7にPython3.9をインストール
- 18. 【2022】APIのAPI(サイト付き)を作った。PythonのBottleで。
- 19. pythonを利用して画像から文字認識をする。
- 20. 【標準入力】ユークリッドの互除法で最大公約数をもとめる【python3】
Pythonスクリプトのメモリリークを探す
どんなプログラミング言語でもメモリリークの追跡は難しいものです。特に、他人の作ったライブラリでメモリリークがある場合、原因を切り分けるのは非常に面倒な仕事になります。
Pythonにはtracemallocという組み込みモジュールがあり、これがメモリリークの調査に便利だったのでまとめてみます。
## メモリ消費量トップ10を出す
tracemallocのマニュアルにも書いてあるのですが、下記のようにするとメモリ消費量のトップ10が出せます。
“`python
import tracemalloctracemalloc.start()
# … メモリリークしてるっぽい処理 …
snapshot = tracemalloc.take_snapshot()
top_stats = snapshot.statistics(‘lineno’)print(“[ Top 10 ]”)
for stat in top_stats[:10]:
print(stat)
“`これを実行すると、下記のような結果が得られます。
“`
[ Top 10 ]
/usr
【Python】話題の音声認識ツールキット Vosk を試してみた
# はじめに
こちらの記事は[Zenn](https://zenn.dev/kama_meshi/articles/517acebcdd1d61)にも投稿しています。
たまたまTLで見かけたので試してみました。結果から言うとすごく簡単、触っていておもしろかったです。
さいきんTLで話題になってたvoskで日本語音声認識を試してみた。精度よい!!
そして例によってNode.jsで書ける? pic.twitter.com/HfQKbZ74v6— ししかわ/Shinya Ishikawa (@meganetaaan) May 15, 2022
# What is Vosk?
20言語以上に対応した音声認識ツールキット。言語モデルが50MBと軽く、組み込みがしやすいです。[^1]
PythonはもちろんのことNode.jsやJava, C#でも実装可能。ラズパイ/iOS/Android用のビルド、Websocketサーバまで用意されているという準備の良さです。
**なおM1 Macには非対応です。**
詳しくは [Vosk](https://alphacephei.com/vosk/) のリファレンスで。# サンプル音声の準備
まずは音源の準備をします。フリーの素材がないかと探していたところ [こえやさん](https://www.
Pythonの勉強方法(初心者)
Pythonの勉強方法を紹介したいと思います。
Pythonといっても、コーディングのレベルはさまざまです。ここでは、データ分析を行なったり機械学習を実装する上で必要なレベルになるための勉強法を紹介します。余談ですが、、、
ちなみに私自身も学部1, 2年の時にPythonのプログラミングの授業がありましたが、その時は全くできませんでした、、
(今もたいして書けませんが、、?)長期休暇にプログラミングの勉強しようと決意してもなかなか続かず、、
いざコードを書いてみても、実行時エラーの意味がわからない、、などなど、苦労しました。
そんな自分が、企業の長期インターンで全く問題なくプログラムを書くレベルまでになった勉強方法を紹介したいと思います。
### ○ 意識したこと
・無理にメソッドを使おうとしなくてOK
・実行時間とか気にせず、自分が書けるコードを書く(無駄が多くてもOK)
・細かいことはとりあえず無視(必要になった時に勉強する)### ○ 実際に行ったこと
・とても簡単な本でいいので、一冊とりあえず頑張ってやってみる。
・YouTubeの動画で勉強する。(←一番
【Python】特定ユーザーの最新の投稿にいいねしたアカウントを全件取得する
# 初めに
ことすたぐらむフォロー機能2のいいねしたアカウントのユーザーIDを全件取得する工程になります。
こちらと、フォロー機能1で搭載した画面からのフォローを組み合わせることで、フォロー機能2は完成します。
順に解説していきます。# 最新の投稿にいいねしたアカウントを全件取得する
## ライブラリをインポートする
まずはライブラリをインポートしましょう。インポートするライブラリはinstaloaderです。instaloaderについては別記事で詳しく書こうと思いますが、非常に使いやすいライブラリです。
“`python:instagram.py
import instaloader
“`
## ログインIDとパスワードを定義する
instaloaderでInstagramにログインするための情報を設定しましょう。
“`python:instagram.py
import instaloader#IDとpasswordを定義
INSTAGRAM_ID = 自分のユーザーID
INSTAGRAM_PASSWORD = 自分のパスワード
“`## Ins
python if文の条件の判定順
すこし気になることがあり、if条件判定順について確認してみた。(個人的メモ)
下のコードのように配列長より長い数値が入りうる変数で配列の要素をチェックする際に、if文を一気に書いた方がインデントが減るので確認してみた。(phpだと定義されている(と認識している)ので、個人的にはよく使っていた)
“`python
import numpy as np
array_Test = np.repeat(True,10)
for i in range(0,15):
if i < len(array_Test) and array_Test[i]==True:#配列の要素をチェックすることを強調 print(i,"True") else: print(i,"False") ## 結果 # 0 True # 1 True # 2 True # 3 True # 4 True # 5 True # 6 True # 7 True # 8 True # 9 True # 10 False # 11 False # 12 False # 13 Fals
重回帰分析にダミー変数を使うとき
# 重回帰分析にダミー変数を使うとき
## 1. 重回帰分析に使用するデータ
“`python
import pandas as pddf5 = pd.DataFrame({
‘x1’: [2, 2, 3, 1, 2, 3, 2, 2, 2, 3, 2, 2, 1, 3, 2, 2, 1, 2, 1, 1],
‘x2’: [2, 2, 3, 2, 2, 1, 2, 3, 2, 3, 2, 1, 3, 2, 2, 1, 1, 3, 2, 1],
‘y’: [17, 20, 24, 15, 20, 19, 20, 22, 20, 26, 24, 14, 22, 23, 23, 19, 13, 27, 17, 13]})
“`前の記事では $x_1$, $x_2$ ともに連続変数として,そのまま説明変数として使った。
今回,$x_2$ をカテゴリー変数として扱うことにする。
`pd.get_dummies()` により,$k$ 個のカテゴリーを表すために **冗長ではあるが** $k$ 個のダミー変数を作る。
$k$ 個のダミー変数は一次従属なので,正規
C1802:use-implicit-booleaness-not-lenと怒られた反省
# 概要
Python3でシーケンス(リストやタプル)の要素が空であるか判定したいとき、以下のようなコードになると思う。
“`python
list_1 = []
if list_1 == []:
print(list_1)[] # 出力
tuple_1 = ()
if tuple_1 == ():
print(tuple_1)() # 出力
“`
if文の条件式での比較対象に、空のシーケンスを指定すればいい。それはそれとして、「Python」「リスト」「空判定」といったキーワードで検索を行うと、以下のような書き方を示すサイトが検索上位に多く表示される。
“`python
list_1 = []
if not len(list_1):
print(list_1)[] # 出力
tuple_1 = ()
if not len(tuple_1):
print(tuple_1)() # 出力
“`
前述のコードのように同じ条件式でリストとタプルの両方の判定を行えるので便利。
ただ、Pylintでコードのチェックを行うと、この
Python学習まとめ
## この文書は何か
普段pythonを書いていないため、忘れていることや学んだことをまとめていきます。業務ではGo言語を使用しているため、Go言語との比較もあるかもです。新米なので、間違っていることなどあれば教えていただけるとありがたいです。
## 簡単な関数の学習まとめ
“`python
# 関数の書き方、戻り値は定義しない
# 任意の3つの数の合計値を求める、3つが全て同じなら3倍にして返す
# 型定義しない
def sumOfAmounts(a, b, c):
if a == b == c:
ans = (a + b + c)*3
else:
ans = a + b + c
return ans
# 下記で複数の数字の標準入力に対応
a,b,c = (int(x) for x in input().split())
sumOfAmounts(a,b,c)
# TODO:pythonってどうやって実行するのdef addls(strings):
if len(strings) >= 2 and strin
A simple script to show Airflow 1.10.9 tasks states in non-GUI environments
## TL;DR
Suppose you have an [Airflow 1.10.9](https://airflow.apache.org/docs/apache-airflow/1.10.9/) (this is important) instance running with [REST API](https://airflow.apache.org/docs/apache-airflow/1.10.9/api.html#) enabled listening
on `https://airflow.work.in` (for example). Suppose further that you have DAG called `my_dag` with tasks `task-1`, `task-2` and `task-3` backfilled from `2022-04-01` till `2022-04-10`. Then, to see the each task’s completion status in non-graphical environment,
Heroku利用方法[Windows]
# 目次
1. 事前準備
1. Herokuの利用
1. Herokuの運用# 1. 事前準備
### Gitインストール
>[こちら](https://www.curict.com/item/60/60bfe0e.html “Gitインストール詳細”)を参考にしながら、Gitをインストールします。
私はすべてデフォルトでインストールしました。### Herokuアカウントを作成
>[こちら](https://jp.heroku.com )から、「無料で新規登録」より作成できます。### HerokuCLIインストール
>[こちら](https://devcenter.heroku.com/ja/articles/heroku-cli)からインストールできます。
CLI -> Command Line Interface# 2. Herokuを利用
### Heroku環境構築
>“`bash
>heroku login # ログインページが起動するので、アカウントを入力する
>heroku create <アプリ名> # アプリを作るフォルダーを作成する
>#
opencv-pythonインストール時に ModuleNotFoundError: No module named ‘skbuild’と言われる
# pipでopencv-pythonインストール時に ModuleNotFoundError: No module named ‘skbuild’と言われる
pipを更新してみましょう。
“` bash
pip3 install –upgrade pip
“`
albumentationsのpipインストール時に生じたopencv-python-headless buildエラーの解消法
## albumentationsインストール時のエラー
albumentationsをpip installする際に下記のエラーが発生。“`:error内容
Traceback (most recent call last):
File “/opt/pyenv/versions/3.9.9/lib/python3.9/site-packages/pip/_vendor/pep517/in_process/_in_process.py”, line 349, in
main()
File “/opt/pyenv/versions/3.9.9/lib/python3.9/site-packages/pip/_vendor/pep517/in_process/_in_process.py”, line 331, in main
json_out[‘return_val’] = hook(**hook_input[‘kwargs’])
File “/opt/pyenv/versions/3.9.9/lib/python3.9/site-pa
Python リストをなるべく均等にN分割する
# はじめに
マルチスレッド(スレッドプール等)で並行処理するときに使えるテクニックです# 方法
“`python
import randomdef split_array(ar, n_group):
for i_chunk in range(n_group):
yield ar[i_chunk * len(ar) // n_group:(i_chunk + 1) * len(ar) // n_group]for _ in range(3):
# 要素数をランダムに決定
elem_count = random.randint(100,1000)
ar = [i for i in range(elem_count)]
# 分割数をランダムに決定
n = random.randint(10,20)splited = split_array(ar, n)
print(f’要素数{elem_count}のリストを{n}分割’)
for elem in splited:
Pythonを使ってミュージックアプリを操作する
やりたいこと(要件)
Pythonを使ってミュージックアプリの”再生・停止・次の曲にスキップ・音量”を操作したい。動作に必要な環境
(1)MacOS(Windowsは対象外)
(2)Python3
(3)PythonからAppleScriptを利用するパッケージ
http://appscript.sourceforge.net/index.html
開発は終了しているようです。手順
(1)実行するPC(Mac)で、以下のコマンドを実行しておく。
pip3 install appscript(2)MusicControlクラスを準備する。
以下の内容をファイルに保存する。ファイル名は”MusicControl.py”
“`python:MusicControl.py
from appscript import appclass MusicControl(object):
“””
AppleScriptを利用して、Musicアプリをコントロールするクラス
注意:MacOSに依存する
“””
def __init__(self):
【AtCoder解説】PythonでABC251のA,B,C,D,E問題を制する!
**ABC251**の**A,B,C,D,E問題**を、**Python3**でなるべく丁寧に解説していきます。
ただ解けるだけの方法ではなく、次の3つのポイントを満たす解法を解説することを目指しています。
– シンプル:余計なことを考えずに済む
– 実装が楽:ミスやバグが減ってうれしい
– 時間がかからない:パフォが上がって、後の問題に残せる時間が増えるご質問・ご指摘は**コメント**か**ツイッター**、**マシュマロ**、Discordサーバーまでお気軽にどうぞ!
**Twitter: [u2dayo](https://twitter.com/u2dayo)**
**マシュマロ: https://marshmallow-qa.com/u2dayo**
**ほしいものリスト: https://www.amazon.jp/hz/wishlist/ls/2T9IQ8IK9ID19?ref_=wl_share**
**Discordサーバー(質問や記事の感想・リクエストなどどうぞ!) : https://discord.gg/jZ8pkPRRMT**
よかったら**LGTM**
beautifulsoupで[特定の親要素]配下の[特定の子要素]だけを取得する方法
## やりたいこと
(備忘録を兼ねての内容なのであしからず)ターゲットとするhtmlから、繰り返される親要素(タグ)のうち、特定の「id」に合致するものを取得。
さらに特定の「class」に該当する子要素(タグ)を取得したい。
※「id」、「class」と記載ありますが、あくまで今回やりたかったケースなので、他の組み合わせも可能## やったこと
beautifulsoupのfindメソッドを連結させることで対応できました。簡単にいえば
find(親要素).find(子要素)
ですね。“`python:
from selenium import webdriver
from bs4 import BeautifulSoup
import rebrowser = webdriver.Chrome((r’C:\Users\[ユーザ名]\chromedriver.exe’)
browser.get([目的のURL])html = browser.page_source
soup = BeautifulSoup(html,’html.parser’)#子要素の名称
Ubntu16.04.7にPython3.9をインストール
## 初めに
備忘録として残します!## opensslをversionアップする
“`bash
cd /usr/local/src
sudo wget https://www.openssl.org/source/openssl-1.1.1o.tar.gz
sudo tar xvf openssl-1.1.1o.tar.gz # 解凍
cd openssl-1.1.1o
sudo ./config # sourceをコンパイルしてインストールする
sudo make
sudo make install
which openssl # opensslの場所を確認
ldd /usr/local/openssl # opensslの共有ライブラリの確認
“`
* wgetを行うダウンロード先は、確認しましょう。
* 共有ライブラリの確認の際、not foundとなっている場合、下のようにldconfigにキャッシュ対象を追加するを参照する## ldonfigにキャッシュ対象を追加する
“`bash
cd ld.so.conf.d/
sudo vim openssl-1.
【2022】APIのAPI(サイト付き)を作った。PythonのBottleで。
# 自己紹介
我の名はふわふわ羊。
ふわふわ~。
C#でゲームを作ったり、Pythonでサイトを作ったりしている野生の羊。# さくっと本題。
http://apis.uvs.jp/
↑GUIサイト
http://apis.uvs.jp/index.py/API
↑APIエンドポイント掲題の通り、APIのAPIを作った。
~~しかし、rapidapiがあるから、いらないんじゃないか?~~
とりあえず、世の中にはAPIがたくさんあるので、びびっと来たものだけをチョイスして登録してある。これを登録すべき!というものがあれば、コメントもしくはメールを頂きたく。にんにん。
# 【これから】
GUIサイトについてだが、やはり視認性を良くすべきだ。
CSSやデザインを改善したい。
それと、もっと楽しく出来ないか!?
例えば「いいね」機能が出来たらみんなハッピーなんじゃないか!?
でも「いいね」を連投されたらどうするんだ!?
あああああ!!!!
ふわふわ~!!!!!*サイトに皆さん書き込んでみてくださいね。
# 【所要時間】
全部込みこみで6時間くらいかかった。
やはりPyth
pythonを利用して画像から文字認識をする。
# 目的
python + Tesseractによる画像処理をOCRで試し、使い勝手を調査します。google ドライブのOCRを使用した場合、画像内の文字認識がかなりの高精度で判断でき、便利なことが分かりました。
ただ、不便なこともいくつかありました。
・複数の画像の処理をする場合、手作業に時間がかる。
・文字認識までに時間がかかる。
・余計なスペースが入る。# OCRとは
OCRは、Optical Character Reader の略で、画像データの文字部分を認識し、デジタルの文字データに変換する光学文字認識機能のことです。例えば、jpgやpngなどの画像データの拡張子ファイルから文字部分を取り出して、書かれている文字をテキストデータにできるようなイメージです。
# 環境
Python version:3.9.7
OS:
【標準入力】ユークリッドの互除法で最大公約数をもとめる【python3】
# ユークリッドの互除法とは
2つの自然数の最大公約数を求める方法の1つ## 使いどころ
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1212456512
# 互除法のやり方
「割り切るまで二つの自然数を割り続ける」やり方を説明する。
①「2つの自然数のうち大きい数÷小さい数」する。
②前の手順の除数(最初は「2つの自然数のうち小さい数」)を前の手順の余りで割る。
③以上の手順を余りが0になるまで繰り返す。
余りが0のときの除数が最大公約数である。※最大公約数とは余りが0になる上に一番大きな「割り切る整数(約数)」で一番大きな「割る方も割られる方も割ることが出来る数(公約数)」
※除数は割る方の数の事である。a÷bのbの方。正式な言い方は調べると出ます。
私が噛み砕いて理解する分には上記の※の文章になります。# pythonで表現するユークリッドの互除法
“`python
a,b=(int(x) for x in input().split())#数字にするため。input(),input()