Ë œÐVh^ãóÄ—UddlmZddlmZmZddlZgZeee d<ejjj«Z ejjj«Ze d deej j"deej$j&deeefded df d „«Zdej$j.d eej j"fd„Zy)é)ÚIterable)ÚAnyÚ no_type_checkNÚ__all__Úoptimizer_classÚparamsÚoptimizer_kwargsÚ register_hookÚreturncóÀ‡‡‡—tjjd«tdtjj ddfˆˆˆfd„«}|D] }||«Œy)a› Upon ``backward()``, the optimizer specified for each parameter will fire after the gradient has been accumulated into the parameter. Note - gradients for these parameters will be set to None after ``backward()``. This means that any other optimizer not specified via `_apply_optimizer_in_backward` over this parameter will be a no-op. Args: optimizer_class: (Type[torch.optim.Optimizer]): Optimizer to apply to parameter params: (Iterator[nn.Parameter]): parameters to apply optimizer state to optimizer_kwargs: (Dict[str, Any]): kwargs to pass to optimizer constructor register_hook: (bool): whether to register a hook that runs the optimizer after gradient for this parameter is accumulated. This is the default way that optimizer in backward is implemented, but specific use cases (such as DDP) may wish to override this to implement custom behavior. (Default = True) Example:: params_generator = model.parameters() param_1 = next(params_generator) remainder_params = list(params_generator) apply_optimizer_in_backward(torch.optim.SGD, [param_1], {"lr": 0.02}) apply_optimizer_in_backward(torch.optim.Adam, remainder_params, {"lr": 0.04}) model(...).sum().backward() # after backward, parameters will already # have their registered optimizer(s) applied. z3torch.distributed.optim.apply_optimizer_in_backwardÚparamrNcó•‡—‰tvr2‰j‰«jjddt‰<‰‰gfi‰¤Ž}t ‰d«sg‰_g‰_g‰_‰j j|«‰jj‰«‰jj‰«‰sydˆfd„}t‰j|«}‰tvr gt‰<t‰j|«y)NrÚ_in_backward_optimizerscóV•—‰jD]}|j«Œd‰_y)N)rÚstepÚgrad)Ú_unusedÚoptr s €úc/home/dcms/DCMS/lib/python3.12/site-packages/torch/distributed/optim/apply_optimizer_in_backward.pyÚoptimizer_hookzc_apply_optimizer_in_backward.._apply_optimizer_in_backward_to_param..optimizer_hookVs*ø€Ø×4Ñ4ò Ø—‘• ð ðˆEJó)rN)Úparam_to_acc_grad_mapÚview_asÚgrad_fnÚnext_functionsÚhasattrrÚ_optimizer_classesÚ_optimizer_kwargsÚappendr Úparam_to_optim_hook_handle_map)r Ú optimizerrÚhandlerr r s` €€€rÚ%_apply_optimizer_in_backward_to_paramzK_apply_optimizer_in_backward.._apply_optimizer_in_backward_to_param8sýù€ðÔ-Ñ-Ø+0¯=©=¸Ó+?×+GÑ+G×+VÑ+VØñ,àñ,Ô! %Ñ(ñ$ U GÑ@Ð/?Ñ@ˆ äuÐ7Ô8Ø,.ˆEÔ)ð(*ˆEÔ$Ø&(ˆEÔ#à ×%Ñ%×,Ñ,¨YÔ7Ø × Ñ ×'Ñ'¨Ô8Ø ×Ñ×&Ñ&Ð'7Ô8áØõ ô' uÑ-×;Ñ;¸NÓKˆØÔ6Ñ6Ø46Ô*¨5Ñ1Ü& uÑ-×4Ñ4°VÕÀÓCÕDðEð€Mr)T)Úcollections.abcrÚtypingrrr$rÚlistÚstrÚ__annotations__ÚutilsÚweakÚWeakTensorKeyDictionaryr rÚtypeÚoptimÚ Optimizerr'r(ÚdictÚboolr)ÚModuler0©rrúr@sñðÞ$ß%ãð€ˆˆc‰Óð"'§¡×!1Ñ!1×!IÑ!IÓ!KÐØŸ™×(Ñ(×@Ñ@ÓBÐðð ñ P5Ø˜%Ÿ+™+×/Ñ/Ñ0ðP5àU—X‘X×'Ñ'Ñ(ðP5ð˜3 ˜8‘nðP5ðð P5ð òP5óðP5ðf¨¯©¯©ð¸DÀÇÁ×AVÑAVÑ