Torros ha scritto: ↑1 ott 2023, 9:27
Se stiamo utilizzando
, la derivata non dovrebbe essere fatta proprio rispetto a tale termine? In sostanza non dovrebbe essere:
? Grazie ancora.
Questa obiezione è veramente molto interessante, in quanto riguarda un punto delicatissimo che necessita di essere affrontato con attenzione. Si deve registrare, cionondimeno, che non vi sia alcuna connessione logico-matematica tra l'oggetto della replica proposta, cioè
Torros ha scritto: ↑1 ott 2023, 9:27
Se stiamo utilizzando
, la derivata non dovrebbe essere fatta proprio rispetto a tale termine?
, e il risultato di
, da te proposto come corretto alla fine del tuo messaggio, che fai dipendere da quest'ultimo. Pertanto, l'equazione
non è corretta
alla luce della motivazione da te addotta: una
ragione più sottile e profonda si nasconde dietro la possibilità (assolutamente sensata e ragionevole, persino corretta) di riscrivere il termine di derivata della Lagrangiana nella maniera da te svelata.
In tal senso, è doveroso estendere la trattazione sulla Lagrangiana relativistica effettuando una premessa. La forma del tipo
rappresenta
canonicamente, rispetto alle derivate parziali, un
abuso di notazione appositamente introdotto al fine di chiarire l'
impiego della derivata rispetto allo sviluppo polinomiale di Taylor. I differenziali parziali si riferiscono a funzioni di più variabili, pertanto non si potrebbe ricorrere alla notazione con gli apici comune alle derivate totali (come
) perché essa non indica quale variabile sta cambiando, a meno che la funzione non sia di
una sola variabile (si tratta di un particolare caso che riguarda proprio la situazione sotto indagine). Il più delle volte si adopera la notazione con pedice, ad esempio
per
, ma nel caso in esame l'abuso di notazione
acquisisce maggiori valenza e rilevanza rispetto al ruolo di puro strumento esplicativo cui sarebbe normalmente stato ridotto, poiché quella a cui ci si sta riferendo non si configura come una vera e propria derivata parziale (ovvero, non lo è
compiutamente rispetto alla sua definizione), dal momento che
è in realtà una funzione di una sola variabile (ovvero,
). Un problema in cui si incorre è quello per il quale, relativamente alla
prime notation, non esiste alcuna possibilità di esprimere la derivata mediante una notazione con l'argomento a cui essa dev'essere applicata: pertanto, qualora si volesse utilizzare la forma in
, si deve rinunciare - anche nel caso di funzione a una sola variabile - alla possibilità (che, in verità, dovrebbe a rigore essere una necessità) di inserire l'argomento indicante tale variabile. Detta
la derivata parziale della Lagrangiana calcolata in
e applicata alla variabile
, è da ritenersi dunque corretta la relazione
, che con buona approssimazione potrebbe considerarsi, dal punto di vista della notazione, corrispondente ad una derivata totale del tipo
.
La risposta specifica corretta, in questo caso, è quella che mira a considerare
una funzione
ben definita. In molti libri di testo di Fisica, una notazione molto poco formale porta le funzioni a
non essere ben definite, solitamente nel senso che lo stesso simbolo viene usato per due funzioni diverse (cfr.
Nota in calce alla pagina per un piccolo approfondimento sull'importanza delle funzioni ben definite).
Quando i matematici affrontano una funzione, la intendono come una regola che consiste nel prendere un
input (o una serie di
input) e produrre un
output. Ad esempio, la regola del "quadrato di". Se
è il simbolo con cui si conviene di indicare tale regola, si scriverà
, da cui
, dove il termine
significa "valutata in
".
La
all'estrema sinistra e quella all'estrema destra si riferiscono a un'entità, mentre le due al centro si rivolgono a un'altra: sarebbe dunque più chiaro e corretto scrivere
, che descrive la medesima situazione.
I fisici, invece, sono interessati alle relazioni funzionali tra variabili fisiche. Se
rappresenta la lunghezza del lato di un quadrato e
la sua area, allora
. Si potrebbe anche visualizzare la precedente relazione mediante la notazione
, ma questa dicitura è decisamente sbagliata. In
,
deve essere una funzione, non una variabile. Ecco perché, qualora si voglia utilizzare l'opzione
o
in luogo di
, è necessario specificare una variabile nel denominatore: si tratta di una sorta di variabile fittizia e aleatoria, lì ubicata soltanto perché non si può omettere. È
necessario inserire
qualcosa nel denominatore. In questo caso, dunque, le tre notazioni
significano tutte "la derivata della funzione
".
Sussiste, in tal senso, una confusione generale sulla regola della catena (
chain rule) a più variabili. Il problema è spesso causato da una mancanza di chiarezza sul ruolo delle funzioni e delle variabili e sul significato preciso di ciascuna derivata. A questo scopo, fondamentale si rivela la necessità di una breve trattazione su tale argomento.
Parte A. Regola della catena a una sola variabile.
1) Notazione funzionale
Si inizi con una descrizione della regola della catena in una dimensione, per la quale occorrono due funzioni
e
e una terza funzione definita dalla composizione di
e
:
Utilizzando
come variabile, si ottiene che:
Con le opportune ipotesi su
e
, la regola della catena stabilisce che:
Si noti che ciò significa: la derivata di
, valutata in un punto
, è uguale alla derivata di
, valutata nel punto
, per la derivata di
, valutata nel punto
. Sebbene tale notazione sia più complicata di quella differenziale che segue in questo approfondimento, essa possiede il vantaggio di mostrare esplicitamente il significato di ogni derivata. Un altro importante punto è quello per cui la notazione
è da considerarsi indipendente dalla variabile
. In altre parole, è possibile usare la notazione
per identificare senza ambiguità la funzione derivata di
, senza dover specificare una variabile. Dissociare una funzione (e la sua derivata) dalla variabile fittizia utilizzata per definirla è un passo importante per comprendere come funzionino realmente le derivate e la regola della catena. Purtroppo, come si vedrà, la notazione matematica
standard rende più difficile tale operazione nel caso di più variabili.
2) Notazione differenziale
La notazione alternativa per la regola della catena, ovviamente, è:
Questa notazione, relativamente agevole e semplice, consente di eseguire rapidamente il calcolo, ma si noti quanta precisione sia stata persa:
1.
adesso sta per due funzioni diverse: l'originale
e la funzione composta
.
2. Si sono persi i punti in cui tali funzioni dovrebbero essere valutate.
3. Cos'è esattamente
?
Questo è il motivo per cui bisogna stare attenti a utilizzare la notazione differenziale, al fine di non perdere di vista come vengano definiti gli oggetti matematici e quale relazione sia funzione di tal altra. Si noti come l'equazione
abbia esattamente lo stesso significato dell'equazione
.
Parte B. Regola della catena a più variabili.
Nel caso del calcolo a più variabili, si parta da una funzione
di diverse variabili indipendenti: ad esempio,
. Assumendo che
sia differenziabile, si possono definire tre nuove funzioni, le derivate parziali di
:
Si noti come la notazione per le derivate parziali sia legata a un particolare insieme di variabili fittizie -
, in questo caso. Ciò, come si vedrà, può generare ambiguità. Per assicurarsi di aver compreso il significato di queste derivate, si riporta qui di seguito un esempio. Sia:
.
Allora, si ha:
Si noti come queste derivate parziali siano esse stesse funzioni delle tre variabili. In generale, una volta definita
, sono state definite anche
, che costituiscono solo tre funzioni applicabili a qualsiasi variabile. Ad esempio, dall'equazione
si ottiene:
Si noti che, tecnicamente,
è in realtà "la funzione ottenuta differenziando
rispetto al suo primo argomento - che si conviene di chiamare
." Non esiste un equivalente della notazione a variabile singola
, che consentirebbe di evitare l'uso della variabile
in questo caso. Nel bene e nel male, si rimane bloccati con le notazioni
e
.
L'ambiguità può sorgere, tuttavia, se
sono essi stessi funzioni di
. Ad esempio, se si definisce:
,
allora si è definita una nuova funzione
di una singola variabile
. La regola della catena prevede che:
Cosa è esattamente
qui, però? È la funzione formata dalla derivata parziale di
rispetto al suo primo argomento. Si noti che il simbolo
è ora sovraccaricato; ma, ancora una volta, si resta bloccati sulla notazione e ci si deve destreggiare nell'uso di
in questi due casi. Nel precedente esempio,
è la funzione definita nell'equazione
, indipendentemente da cosa siano
.
In effetti, le condizioni peggiorano. Se semplicemente
e, come spesso accade, invece di
si utilizzano
, ora sono stati sovraccaricati i tre termini
. Si ha:
,
e la regola della catena in questo caso restituisce:
,
dove, tecnicamente,
sono usati sia per le variabili fittizie con cui è stata definita
(e che sono usate per indicare le derivate parziali di
) sia come funzioni di
.
Per illustrare ciò, si potrebbe, ad esempio, scrivere in maiuscolo le lettere che denotano a quale derivata parziale ci si riferisce quando rappresentino variabili fittizie, e lasciarle nella loro intrinsecità quando descrivano variabili e funzioni specifiche. Questo porterebbe a:
Ciò evidenzia che
denotano le derivate parziali prima, seconda e terza di
e che, di fatto, non sono correlate alle variabili
in esame: distinzione che nella notazione usuale dell'equazione
non è evidentemente stata avanzata.
Nella notazione differenziale, l'equazione
diventa:
,
dove il membro sinistro dell'equazione è spesso chiamato derivata "totale" di
.
Si noti, tuttavia, come
non si tratti veramente di una derivata di
, quanto piuttosto della derivata della funzione composta
, che è stata definita nell'equazione
di cui sopra. Questa analisi, se non altro, può almeno togliere un po' di ambiguità alla derivata "totale"
e alla derivata parziale
.
Sebbene l'equazione
costituisca la forma della regola della catena con cui la maggior parte delle persone ha familiarità, la sua notazione nasconde una moltitudine di errori. Qualora ci si confonda con la regola della catena, vale la pena essere in grado di decostruirla fino al formato funzionale (equazione
) per capire cosa stia realmente accadendo.
Il passaggio chiave in questo processo è il riconoscimento della circostanza per cui si è fatto ricorso ai simboli
, e alla funzione
, in due ruoli diversi. In realtà, nella notazione matematica standard è piuttosto raro dover utilizzare lo stesso simbolo in due ruoli diversi, ma la regola della catena a più variabili nelle equazioni
e
è un caso del genere.
Parte C. Esempio di carattere fisico
Per illustrare l'uso della regola della catena a più variabili in un contesto fisico, si consideri una particella sotto un potenziale dipendente dal tempo, definito come una funzione di quattro variabili:
.
è una funzione a più variabili con quattro derivate parziali (a loro volta funzioni a più variabili):
. Si noti come queste funzioni siano generalmente definite per
, indipendentemente da ciò che la particella sta facendo. A questo punto, se la particella percorre una specifica traiettoria nello spazio, è possibile definire una nuova funzione che rappresenti il potenziale della particella lungo la sua traiettoria:
.
Si noti che spesso i testi adotteranno lo stesso simbolo per entrambe tali funzioni e scriveranno semplicemente:
,
sovraccaricando il simbolo
e confidando che lo studente non si confonda su come vengano calcolate le derivate. Si rimarrà su tale convenzione, anche se sarebbe preferibile distinguere le funzioni scrivendo
sul membro sinistro, come nell'equazione
. In ogni caso, è possibile calcolare come il potenziale vari con il tempo (alla fine, per semplicità, si tralasceranno le variabili e si scriverà
et cetera):
,
oppure, in notazione differenziale:
Questa è la notazione standard, ma si può vedere dalle equazioni
e
come la
sul membro a sinistra sia in realtà una funzione diversa dalla
sul membro a destra.
Si noti anche che
è la derivata parziale della funzione
rispetto alla sua coordinata
. Questa
non è la stessa funzione
che rappresenta la coordinata
della particella nel tempo. In altre parole,
è la stessa funzione, indipendentemente dal percorso della particella. Il percorso della particella
è l'insieme dei punti in cui questa funzione
viene valutata su quel particolare percorso. Una specifica fonte di confusione è quella per cui lo studente ritiene di dover differenziare la funzione
lungo la particolare traiettoria della particella per ottenere
(o
): non è questo il caso.
(o
) viene calcolata da una generale derivata spaziale prima di considerare una particolare traiettoria, e solo successivamente tale funzione viene valutata lungo quest'ultima.
Conclusione generale
Una comprensione approfondita della regola della catena a una variabile è un prerequisito importante per il calcolo a più variabili. La regola della catena a più variabili comporta un certo sovraccarico dei simboli
e, nella consueta notazione differenziale, un sovraccarico del simbolo rappresentante la funzione. Tali ambiguità devono essere affrontate e comprese. Inoltre, la notazione differenziale tralascia molti dettagli su come si definiscono gli oggetti e sui punti in cui vengono valutati. La possibilità di tornare alla notazione funzionale può spesso chiarire cosa stia realmente accadendo. In un contesto fisico, è importante distinguere dove una funzione sia definita e sia stata differenziata rispetto alle coordinate spaziali e temporali generali - ottenendo le sue derivate parziali
,
et cetera - e dove queste derivate parziali siano valutate in punti specifici, ad esempio lungo la traiettoria di una particella.
Conclusione specifica
La conclusione più appropriata alla domanda è quella in accordo alla quale
non vi è una soluzione totalmente soddisfacente, in quanto si rimane bloccati con la notazione. Nella notazione
standard, il problema consiste nel fatto che, riguardo le derivate parziali, non esiste una notazione senza argomenti per la derivata. Non si tratta di un errore, dunque, ma di una carenza nella notazione differenziale.
A sostegno della notazione
, si potrebbe avanzare la seguente obiezione:
Per definizione,
, qualunque sia
. Poiché si ha
a sinistra, così dev'essere anche nel membro a destra.
Questa argomentazione è errata. Come
è una regola funzionale, così
è una regola funzionale.
sarebbe il valore che la regola funzionale produce quando le viene dato
come
input.
Il modo corretto di scrivere l'espressione è
, dove la
più a sinistra e quella più a destra si riferiscono a un'entità, mentre le due al centro si riferiscono a un'altra. Sarebbe cioè più chiaro scrivere:
, che dunque
non rispetta l'assunzione di coerenza, precedentemente asserita, tra l'argomento
in cui viene calcolata la derivata
e la variabile
al denominatore della derivata parziale
.
In favore della notazione
, si potrebbe addurre la prova di cui sotto:
Si consideri una funzione
con un'espansione in serie di Taylor:
Adesso, se si vuole sostituire la derivata con la forma differenziale, cosa usare:
oppure
? Preferibilmente sarebbe meglio introdurre
, quale punto variabile, al denominatore della derivata
, in quanto la derivata rispetto ad
sembra
strana e include il punto di riferimento (o di valutazione).
La comune convinzione popolare ritiene che la variabile rispetto alla quale calcolare la derivata, presente al denominatore di
ogni derivata in notazione differenziale, debba sempre, necessariamente, rappresentare
stricto sensu la variabile che cambia, fondamentale per il risultato finale in quanto è proprio in questo punto di spostamento che si vuole calcolare la derivata finale più generale. In molti casi (questo compreso), soprattutto nelle derivate parziali, il denominatore è invece occupato dalle cosiddette
dummy variables, variabili fittizie che appaiono in alcuni calcoli solo come marcatori (
placeholders, obbedienti solo alla stretta necessità di occupare una posizione) e, relativamente alla determinata operazione (in questo caso, la derivata parziale), scompaiono completamente nel risultato finale non influendo su quest'ultimo.
Pertanto, la questione è puramente concernente la notazione: è possibile scrivere, indistintamente,
o
. Nessuna delle due notazioni è più corretta dell'altra: per questo motivo i matematici preferiscono la notazione funzionale di derivazione (
derivative notation)
,
, etc. per le serie di Taylor, quando possibile.
È dunque importante notare, soprattutto dal punto di vista dell'analisi funzionale, che una funzione è definita indipendentemente da qualsiasi variabile e che una funzione di una sola variabile possiede derivata unica: in questo caso, quindi, l'operatore differenziale è unico. Pertanto, anche se alcune notazioni richiedono una variabile del tipo
, si tratta comunque di una variabile fittizia. Invece, quando viene richiamato un "cambio di variabili", ci si ritrova con due funzioni diverse indicate dalla stessa lettera: in questo caso, le variabili non sono più fittizie, poiché determinano quale funzione si intenda utilizzare. Quando vi sono due funzioni diverse, vi sono anche due derivate diverse: anche in questo caso, la variabile indica quale funzione si intenda utilizzare.
Nota. Una funzione si dice ben definita quando bisogna verificare che la definizione fornisca un
unico valore
output per ogni valore
input. Il termine
ben definito (in contrapposizione a - banalmente -
definito) è tipicamente usato quando una definizione dipende da una scelta solo
apparentemente, ma non effettivamente. Nella maggior parte dei casi (ma non in tutti), ciò si applica alla definizione di una funzione
in termini di due date funzioni
e
. Per
, si vuole definire
scegliendo prima un elemento
con
, in modo che successivamente sia
. In questo caso sorgono due problemi: 1) innanzitutto, ci si deve assicurare che per ogni
esista una
con
; in altre parole:
deve essere suriettiva; 2) ci si deve accertare che la scelta di
sia irrilevante, ovvero che: ogni volta che
, allora deve valere anche che
. Solo se
soddisfano tali condizioni, la costruzione di cui sopra definirà effettivamente una funzione
. Dunque, dopo questa costruzione,
è di fatto definita. La definizione stessa non diventa "migliore" dicendo che
è ben definita; al contrario, dire che
è ben definita afferma semplicemente il fatto (auspicabilmente dimostrabile) che le condizioni sopra descritte valgono per
, dunque si è veramente, in questo modo, enunciata una definizione di
. Qualora le condizioni non siano soddisfatte,
non sarebbe in qualche modo "meno ben definita", più semplicemente non sarebbe affatto definita.
In altri termini, una funzione
è, per (ordinaria) definizione, una relazione
con due proprietà:
1) Per tutti gli
esiste una
tale che
;
2) Per tutti gli
, se
, allora
.
Il secondo assioma è quello che rende una funzione "ben definita". Non v'è bisogno di addurre alcuna prova per dimostrare che "le funzioni sono ben definite" (infatti, lo sono per definizione), ma molto spesso si dispone di una regola inventata per creare una relazione e si deve dimostrare che "tale relazione ha le proprietà 1) e 2), dunque è una funzione ben definita". Quando si definisce una funzione sull'insieme delle classi di equivalenza
da una relazione di equivalenza su un insieme
, appare naturale definire le funzioni solo in termini di elementi di
e chiedersi, poi, se siano ancora funzioni su
. Questo, tuttavia, non è automatico. Si considerino i numeri razionali, che vengono solitamente rappresentati come coppie di numeri interi, scritti nella forma
, con
. Questa è, però, solo una rappresentazione non univoca, perché molte coppie di questo tipo rappresentano lo stesso numero razionale. Ad esempio,
,
e
rappresentano tutti lo stesso numero razionale. La regola generale è quella per cui
e
rappresentano lo stesso numero razionale se
. Si supponga ora di voler definire una funzione sui numeri razionali attraverso la rappresentazione
, dunque si deve definire
in termini di
e
.
Si consideri la definizione della funzione
. Essa presenta un grave problema: non è una funzione ben definita dei numeri razionali, perché restituisce, ad esempio,
,
e
. Ma
,
e
rappresentano lo stesso numero razionale, dunque sembra che si voglia affermare che
ha diversi valori in corrispondenza di tale numero razionale. Questa
non è una funzione ben definita perché non dipende dall'argomento in sé, ma da come si è scelto di scriverlo.
Al contrario, se si definisce
in modo che
, si trova che
,
, e
; in effetti, si può dimostrare che per qualsiasi
e
, con
, si ha sempre
. Si può anche dimostrare che
dipende solo dal valore frazionario
, non dai particolari
e
scelti per rappresentarlo. Questa è una funzione
ben definita dei numeri razionali.
Il problema è quello per cui non si possiede una definizione diretta di numeri razionali, che si definiscono invece come
classi di coppie di numeri interi
e
. Se si vuole definire una funzione di un numero razionale in termini della coppia di numeri interi che lo rappresenta, la definizione deve restituire lo stesso valore per ogni coppia equivalente di numeri interi
e
, per qualsiasi coppia della stessa classe di coppie. Altrimenti, può essere una funzione perfettamente valida di coppie di numeri interi, ma
non è una funzione di numeri razionali. Lo stesso problema si pone ogni qualvolta si definisca qualcosa in termini di classi di equivalenza. Se
è un gruppo e
un sottogruppo di
, si possono costruire le classi
di sottoinsiemi sinistri di
. Si vorrebbe poi definire un'operazione
su questi
cosects, tipicamente
. Si noti, tuttavia, che ciò dipende dalla scelta dei rappresentanti
e
dai sottoinsiemi
e
: si potrebbe infatti avere
e
anche quando
e
. In tal caso, sarebbe meglio scrivere
, altrimenti la definizione di
non avrebbe senso, così come
, perché fornisce più di un valore possibile per una particolare scelta di argomenti. Risulta, dunque, che tali definizioni hanno senso proprio quando
è un sottogruppo normale di
: proprio questo è il motivo dell'importanza dei sottogruppi normali. Concludendo questa parentesi, semplicemente, non si può assumere che ogni relazione ottenuta in termini di
sia una funzione sulle classi di equivalenza di un'equivalenza su
.
In definitiva, dunque, se si vuole asserire che
è una funzione
ben definita, con dominio
e codominio
dati, è necessario verificare che:
1)
è una relazione da
a
:
2) Il dominio di
è
e ogni elemento di
è in relazione a un qualche elemento di
:
3) Nessun elemento di
è in relazione a più di un elemento di
:
.
Dunque, assumere che una relazione sia
ben definita significa concludere che tutte e tre le condizioni siano vere. Se si conoscono alcuni di questi requisiti, bisogna solo verificare gli altri: ad esempio, se si conosce che
possieda la terza proprietà (quindi, è una funzione), si deve verificare che il suo dominio è
e l'intervallo è un sottoinsieme di
; se, invece, sono note queste proprietà, si deve verificare la terza condizione.
Se non è dato che
soddisfi la terza condizione, tuttavia, non è possibile scrivere
, in quanto tale termine presuppone che vi sia una definizione unica per quell'elemento di
. Dunque, non si può usare il termine
prima di sapere che esso sia univocamente definito.