Ë
    œÐVhr  ã                   óž   — U d dl mZ d dlZd dlmc mZ d dlmZ d dlm	Z	 g Z
ee   ed<   ej                  j                   G d„ d«      «       Zy)é    )ÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c                   ób   — e Zd Z	 	 	 	 	 	 	 ddee   dededededededefd	„Zd
eee      fd„Z	y)Ú_FunctionalAdadeltaÚparamsÚlrÚrhoÚepsÚweight_decayÚforeachÚmaximizeÚ_allow_empty_param_listc	                 óF  — t        d¬«       ||||dœ| _        || _        || _        t	        |«      dk(  r|st        d«      ‚d|i| _        t        j                  j                  t        t        j                  t        t        t        j                  f   f   i «      | _        y )Né   )Ú
stacklevel)r
   r   r   r   r   z%optimizer got an empty parameter listr	   )r   Údefaultsr   r   ÚlenÚ
ValueErrorÚparam_groupÚtorchÚjitÚannotateÚdictr   ÚstrÚstate)	Úselfr	   r
   r   r   r   r   r   r   s	            ú[/home/dcms/DCMS/lib/python3.12/site-packages/torch/distributed/optim/functional_adadelta.pyÚ__init__z_FunctionalAdadelta.__init__   s   € ô 	;ÀaÕHàØØØ(ñ	
ˆŒð ˆŒØ ˆŒäˆv‹;˜!ÒÑ$;ÜÐDÓEÐEð % fÐ-ˆÔä—Y‘Y×'Ñ'¬¬U¯\©\¼4ÄÄUÇ\Á\Ð@QÑ;RÐ-RÑ(SÐUWÓXˆ
ó    Ú	gradientsc                 óT  — | j                   d   }g }g }g }g }g }| j                  d   }| j                  d   }	| j                  d   }
| j                  d   }t        |«      t        |«      k7  r*t        ddt        |«      › dz   d	t        |«      › z   «      ‚d
}t	        ||«      D ]"  \  }}|€Œ
|t        j                  |«      z  }|j                  |«       |j                  |«       || j                  vr†i | j                  |<   | j                  |   }t        j                  d«      |d<   t        j                  |t
        j                  ¬«      |d<   t        j                  |t
        j                  ¬«      |d<   | j                  |   }|j                  |d   «       |j                  |d   «       |j                  |d   «       Œ% t        j                  «       5  t        j                  |||||||	|
|| j                  | j                   |¬«       d d d «       y # 1 sw Y   y xY w)Nr	   r
   r   r   r   zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: Fç        Ústep)Úmemory_formatÚ
square_avgÚ	acc_delta)r
   r   r   r   r   r   Úhas_complex)r   r   r   r   Úzipr   Ú
is_complexÚappendr   ÚtensorÚ
zeros_likeÚpreserve_formatÚno_gradÚFÚadadeltar   r   )r   r"   r	   Úparams_with_gradÚgradsÚsquare_avgsÚ
acc_deltasÚstate_stepsr
   r   r   r   r)   ÚparamÚgradientr   s                   r   r%   z_FunctionalAdadelta.step8   s  € Ø×!Ñ! (Ñ+ˆØÐØˆØˆØˆ
ØˆØ]‰]˜4Ñ ˆØm‰m˜EÑ"ˆØm‰m˜EÑ"ˆØ—}‘} ^Ñ4ˆäˆv‹;œ#˜i›.Ò(ÜØWØ#¤C¨£K =°Ð3ñ4à&¤s¨9£~Ð&6Ð7ñ8óð ð
 ˆÜ" 6¨9Ó5ó 	2‰OˆE8ØÑ#Øœu×/Ñ/°Ó6Ñ6Ø ×'Ñ'¨Ô.Ø—‘˜XÔ&à §
¡
Ñ*Ø(*D—J‘J˜uÑ%Ø ŸJ™J uÑ-EÜ$)§L¡L°Ó$5E˜&‘MÜ*/×*:Ñ*:Ø¬U×-BÑ-Bô+E˜,Ñ'ô */×)9Ñ)9Ø¬U×-BÑ-Bô*E˜+Ñ&ð Ÿ
™
 5Ñ)Ø×"Ñ" 5¨Ñ#6Ô7Ø×!Ñ! %¨Ñ"4Ô5Ø×"Ñ" 5¨¡=Ö1ð)	2ô, ]‰]‹_ñ 	ÜJ‰JØ ØØØØØØØØ)ØŸ™ØŸ™Ø'õ÷	÷ 	ñ 	ús   Ç6HÈH'N)g      ð?gÍÌÌÌÌÌì?gíµ ÷Æ°>r$   FFF)
Ú__name__Ú
__module__Ú__qualname__Úlistr   ÚfloatÚboolr    r   r%   © r!   r   r   r      s   „ ð
 ØØØ!ØØØ(-ñYàV‘ðYð ðYð ð	Yð
 ðYð ðYð ðYð ðYð "&óYð<7˜d 8¨FÑ#3Ñ4ô 7r!   r   )Útypingr   r   Útorch.optim._functionalÚoptimÚ_functionalr1   r   Ú,torch.distributed.optim._deprecation_warningr   r   r=   r   Ú__annotations__r   Úscriptr   r@   r!   r   ú<module>rH      sO   ðæ ã ß #Ð #Ý õð
 €ˆˆc‰Ó ð ‡×Ñ÷Vð Vó ñVr!   