# --- # jupyter: # jupytext: # formats: ipynb,py:percent # text_representation: # extension: .py # format_name: percent # format_version: '1.3' # jupytext_version: 1.14.0 # kernelspec: # display_name: Python 3 (ipykernel) # language: python # name: python3 # --- # %% [markdown] slideshow={"slide_type": "notes"} toc=true #

RECAP: COME analizzare un problema?
- RECAP: k massimi di N numeri
Qualche micro nozione di complessità temporale dei programmi
- Come si comportano gli ordini di grandezza
Nuovo vincolo: vogliamo usare poca memoria
- - k massimi N numeri estratti a caso
  - Per aggiornare i k valori con un nuovo X
- Nuova idea: tenere la lista di k elementi ordinata
Wooclap: quanto ho capito gli argomenti di oggi ?

# %% [markdown] slideshow={"slide_type": "slide"} # # # Fondamenti di Programmazione # # # **Andrea Sterbini** # # lezione 7 - 24 ottobre 2022 # %% [markdown] slideshow={"slide_type": "slide"} # # RECAP: COME analizzare un problema? # - cerchiamo di capire come lo faremmo su carta # - descrivendo gli **input ed output** # - eventuali **controlli da fare sui dati** # - possibili **errori da generare** # - possibili **effetti collaterali** # - possibili **scelte non indicate** # %% [markdown] slideshow={"slide_type": "subslide"} # - lo dividiamo in **problemi più piccoli** # - ripetendo il metodo di analisi # # - **continuando a frammentarlo** finchè # - la sua **descrizione è così semplice** # - da poter essere **implementato** # # - mano a mano **testiamo le sottofunzioni** realizzate # - **semplificando enormemente il debug** # %% [markdown] slideshow={"slide_type": "slide"} # ## RECAP: k massimi di N numeri # # Se **tengo tutti i dati in memoria** # - versione modifica distruttiva (tempo $O(N*k)$) # - versione copia e modifica (tempo $O(N*k)$) # - versione ordinamento e estrazione (tempo $O(N*log(N)) # %% [markdown] slideshow={"slide_type": "subslide"} # # Qualche micro nozione di complessità temporale dei programmi # **$O(f(n))$** : nel caso peggiore il tempo impiegato è ___"simile"___ # alla funzione **$f(n)$** (con **n** che è la dimensione dei dati in input) # # ovvero "si comporta" o "cresce" come la funzione **$f(n)$** # %% [markdown] slideshow={"slide_type": "subslide"} # Dal più veloce al più lento: # - **$O(1)$** : tempo costante (non dipende dall'input) # - **$O(log(N))$** : tempo logaritmico rispetto all'input (per ogni raddoppio di N il tempo aumenta di 1) # - **$O(N)$** : tempo proporzionale all'input (se N raddoppia il tempo raddoppia) # - **$O(N*log(N))$** : tempo proporzionale all'input * il suo logaritmo (p.es. sort) # - **$O(N^2)$** : tempo quadratico (se N raddoppia il tempo*4) # - **$O(2^N)$** : tempo esponenziale (se N aumenta di 1, il tempo raddoppia) # # logaritmo = numero di cifre binarie # %% [markdown] slideshow={"slide_type": "subslide"} # ## Come si comportano gli ordini di grandezza # Visto che stiamo cercando **il caso peggiore**: # # Se **$N$** è la dimensione dell'input da elaborare: # # la formula | | diventa | | perchè # :------------------|-|:-------------------:|-|-----------: # costante * O(F(N)) | | O(F(N)) | | ignoriamo i fattori costanti # O(F(N)) + O(G(N)) | | O(max(F(N),G(N))) | | vogliamo il caso peggiore # O(F(N)) * O(G(N)) | | O(F(N)*G(N)) | | si moltiplicano # %% [markdown] slideshow={"slide_type": "subslide"} # **Esempi:** # - $O(5*n) ==> O(n)$ (si ignorano i fattori costanti) # - $O(log(n)) + O(1) ==> O(log(n))$ (il logaritmo cresce mentre una costante no) # - $O(log(n)) + O(n) ==> O(n)$ ( il logaritmo cresce più lentamente di n) # - $O(n)*O(n) ==> O(n^2)$ # - $O(n)*O(log(n)) + O(n) ==> O(n*log(n))$ (n*log cresce più rapidamente di n) # # %% [markdown] slideshow={"slide_type": "subslide"} # ![](lavagna.png) # %% [markdown] slideshow={"slide_type": "subslide"} # # Nuovo vincolo: vogliamo usare poca memoria # # Non ci serve ricordare o ordinare **tutti i valori** di L!!!! # %% [markdown] slideshow={"slide_type": "fragment"} # Basta ricordare **SOLO k valori** (i migliori finora) # %% [markdown] slideshow={"slide_type": "subslide"} # ### k massimi N numeri estratti a caso # - definisco ed inizializzo una lista vuota per i k valori (tempo costante) # - estraggo/leggo i valori e per ciascuno (N volte) # - **aggiorno la lista dei k migliori già visti** (tempo ???) # - ritorno la lista dei k valori finale (tempo costante) # %% [markdown] slideshow={"slide_type": "subslide"} # ### Per aggiornare i k valori con un nuovo X # - se la lista di valori ha meno di k elementi # - aggiungo il nuovo valore (tempo costante) # %% [markdown] slideshow={"slide_type": "fragment"} # - se X è <= del minimo dei k valori (tempo $O(k)$) # - lo posso ignorare (sono tutti meglio) # %% [markdown] slideshow={"slide_type": "fragment"} # - altrimenti è maggiore del minimo # - tolgo il valore più piccolo (tempo $O(k)$) # - aggiungo il nuovo valore (tempo costante) # %% slideshow={"slide_type": "subslide"} import random # per ottenere i k massimi di tantissimi valori # estratti a caso def k_massimi_da_seq_casuale(k, N, seed): # settare il generatore al valore iniziale random.seed(seed) # definisco ed inizializzo una lista vuota # per i k valori massimi = [] # genero i valori in input e per ciascuno for _ in range(N): X = random.randint(-1000000,+1000000) # aggiorno la lista dei k migliori già visti aggiorna_k_massimi(massimi, X, k) # ritorno la lista dei k valori finale return massimi def aggiorna_k_massimi_dummy(massimi, X, k): massimi.append(X) if len(massimi) > k: massimi.pop(0) #k_massimi_da_seq_casuale(10, 10000, 0) # %% slideshow={"slide_type": "subslide"} # per aggiornare la lista dei k valori # con un nuovo valore X def aggiorna_k_massimi(L, X, k): # se la lista di valori ha meno di k elementi if len(L) < k: # aggiungo il nuovo valore L.append(X) return # se X è minore o uguale del minimo dei k valori minimo = min(L) if X <= minimo: # lo posso ignorare return # altrimenti è maggiore del minimo # tolgo il valore più piccolo L.remove(minimo) # aggiungo il nuovo valore L.append(X) valori = [] random.seed(0) for _ in range(20): valori.append(random.randint(-1000000, +1000000)) valori.sort() print(valori) k_massimi_da_seq_casuale(4,20,0) # %% slideshow={"slide_type": "fragment"} # %timeit k_massimi_da_seq_casuale(3, 1000000, 0) # %timeit k_massimi_da_seq_casuale(30, 1000000, 0) # %timeit k_massimi_da_seq_casuale(300, 1000000, 0) # %timeit k_massimi_da_seq_casuale(3000, 1000000, 0) None # %% [markdown] slideshow={"slide_type": "subslide"} # ## Nuova idea: tenere la lista di k elementi ordinata # e se tenessi la lista di k valori ordinata??? # %% [markdown] slideshow={"slide_type": "fragment"} # - trovare il minimo è costante (ultimo elemento) # - eliminare il minimo è costante # - per mantenere la lista ordinata # - aggiungere l'elemento (tempo costante) # - riordinare la lista (tempo $O(k*log(k)$) # %% slideshow={"slide_type": "subslide"} # Versione che tiene ordinata la lista di K elementi def aggiorna_lista_k_massimi_ordinati(Lordinata, X, K): # se len(Lordinata) < K if len(Lordinata) < K: # aggiungo il valore Lordinata.append(X) # mantengo ordinata la lista (tempo O(K*log(K))) Lordinata.sort(reverse=True) return # se X <= minimo if Lordinata[-1] >= X: # posso ignorarlo, esco return # altrimenti se X è maggiore del minimo # lo aggiungo e tolgo il minimo Lordinata[-1] = X # mantengo ordinata la lista (tempo O(K*log(K))) Lordinata.sort(reverse=True) # %% slideshow={"slide_type": "subslide"} # per ottenere i k massimi di tantissimi valori # estratti a caso def k_massimi_da_seq_casuale_ordinata(k, N, seed): # settare il generatore al valore iniziale random.seed(seed) # definisco ed inizializzo una lista vuota # per i k valori massimi = [] # genero i valori in input e per ciascuno for _ in range(N): X = random.randint(-1000000,+1000000) # aggiorno la lista dei k migliori già visti aggiorna_lista_k_massimi_ordinati(massimi, X, k) # ritorno la lista dei k valori finale return massimi # Tempo totale: proporzionale a N*K*log(K) valori = [] random.seed(0) for _ in range(20): valori.append(random.randint(-1000000, +1000000)) valori.sort() print(valori) k_massimi_da_seq_casuale_ordinata(4,20,0) # %% slideshow={"slide_type": "subslide"} # %timeit k_massimi_da_seq_casuale_ordinata(3, 1000000, 0) # %timeit k_massimi_da_seq_casuale_ordinata(30, 1000000, 0) # %timeit k_massimi_da_seq_casuale_ordinata(300, 1000000, 0) # %timeit k_massimi_da_seq_casuale_ordinata(3000, 1000000, 0) None # %% [markdown] slideshow={"slide_type": "subslide"} # ### NOTA: L'aggiornamento della lista ordinata può essere fatto più rapidamente se # - troviamo la posizione dove inserire X
con una ricerca binaria (tempo *O(log(k))*) # - e poi un insert (tempo $O(k)$) # # Ovvero tempo $O(k + log(k)) ==> O(k)$ # # Prima avevamo $O(k*log(k))$ !!! # %% [markdown] slideshow={"slide_type": "subslide"} # Quindi la soluzione potrebbe scendere a # - Tempo totale: proporzionale a $N*K$
# (se $K<

Table of Contents