]> git.madduck.net Git - etc/vim.git/blob - black.py

madduck's git repository

Every one of the projects in this repository is available at the canonical URL git://git.madduck.net/madduck/pub/<projectpath> — see each project's metadata for the exact URL.

All patches and comments are welcome. Please squash your changes to logical commits before using git-format-patch and git-send-email to patches@git.madduck.net. If you'd read over the Git project's submission guidelines and adhered to them, I'd be especially grateful.

SSH access, as well as push access can be individually arranged.

If you use my repositories frequently, consider adding the following snippet to ~/.gitconfig and using the third clone URL listed for each project:

[url "git://git.madduck.net/madduck/"]
  insteadOf = madduck:

b3f387ac24465ca5fa7a99ec8076f6832886e15f
[etc/vim.git] / black.py
1 import ast
2 import asyncio
3 from abc import ABC, abstractmethod
4 from collections import defaultdict
5 from concurrent.futures import Executor, ProcessPoolExecutor
6 from contextlib import contextmanager
7 from datetime import datetime
8 from enum import Enum
9 from functools import lru_cache, partial, wraps
10 import io
11 import itertools
12 import logging
13 from multiprocessing import Manager, freeze_support
14 import os
15 from pathlib import Path
16 import pickle
17 import regex as re
18 import signal
19 import sys
20 import tempfile
21 import tokenize
22 import traceback
23 from typing import (
24     Any,
25     Callable,
26     Collection,
27     Dict,
28     Generator,
29     Generic,
30     Iterable,
31     Iterator,
32     List,
33     Optional,
34     Pattern,
35     Sequence,
36     Set,
37     Tuple,
38     Type,
39     TypeVar,
40     Union,
41     cast,
42 )
43 from typing_extensions import Final
44 from mypy_extensions import mypyc_attr
45
46 from appdirs import user_cache_dir
47 from dataclasses import dataclass, field, replace
48 import click
49 import toml
50 from typed_ast import ast3, ast27
51 from pathspec import PathSpec
52
53 # lib2to3 fork
54 from blib2to3.pytree import Node, Leaf, type_repr
55 from blib2to3 import pygram, pytree
56 from blib2to3.pgen2 import driver, token
57 from blib2to3.pgen2.grammar import Grammar
58 from blib2to3.pgen2.parse import ParseError
59
60 from _black_version import version as __version__
61
62 DEFAULT_LINE_LENGTH = 88
63 DEFAULT_EXCLUDES = r"/(\.eggs|\.git|\.hg|\.mypy_cache|\.nox|\.tox|\.venv|\.svn|_build|buck-out|build|dist)/"  # noqa: B950
64 DEFAULT_INCLUDES = r"\.pyi?$"
65 CACHE_DIR = Path(user_cache_dir("black", version=__version__))
66
67 STRING_PREFIX_CHARS: Final = "furbFURB"  # All possible string prefix characters.
68
69
70 # types
71 FileContent = str
72 Encoding = str
73 NewLine = str
74 Depth = int
75 NodeType = int
76 ParserState = int
77 LeafID = int
78 StringID = int
79 Priority = int
80 Index = int
81 LN = Union[Leaf, Node]
82 Transformer = Callable[["Line", Collection["Feature"]], Iterator["Line"]]
83 Timestamp = float
84 FileSize = int
85 CacheInfo = Tuple[Timestamp, FileSize]
86 Cache = Dict[Path, CacheInfo]
87 out = partial(click.secho, bold=True, err=True)
88 err = partial(click.secho, fg="red", err=True)
89
90 pygram.initialize(CACHE_DIR)
91 syms = pygram.python_symbols
92
93
94 class NothingChanged(UserWarning):
95     """Raised when reformatted code is the same as source."""
96
97
98 class CannotTransform(Exception):
99     """Base class for errors raised by Transformers."""
100
101
102 class CannotSplit(CannotTransform):
103     """A readable split that fits the allotted line length is impossible."""
104
105
106 class InvalidInput(ValueError):
107     """Raised when input source code fails all parse attempts."""
108
109
110 T = TypeVar("T")
111 E = TypeVar("E", bound=Exception)
112
113
114 class Ok(Generic[T]):
115     def __init__(self, value: T) -> None:
116         self._value = value
117
118     def ok(self) -> T:
119         return self._value
120
121
122 class Err(Generic[E]):
123     def __init__(self, e: E) -> None:
124         self._e = e
125
126     def err(self) -> E:
127         return self._e
128
129
130 # The 'Result' return type is used to implement an error-handling model heavily
131 # influenced by that used by the Rust programming language
132 # (see https://doc.rust-lang.org/book/ch09-00-error-handling.html).
133 Result = Union[Ok[T], Err[E]]
134 TResult = Result[T, CannotTransform]  # (T)ransform Result
135 TMatchResult = TResult[Index]
136
137
138 class WriteBack(Enum):
139     NO = 0
140     YES = 1
141     DIFF = 2
142     CHECK = 3
143
144     @classmethod
145     def from_configuration(cls, *, check: bool, diff: bool) -> "WriteBack":
146         if check and not diff:
147             return cls.CHECK
148
149         return cls.DIFF if diff else cls.YES
150
151
152 class Changed(Enum):
153     NO = 0
154     CACHED = 1
155     YES = 2
156
157
158 class TargetVersion(Enum):
159     PY27 = 2
160     PY33 = 3
161     PY34 = 4
162     PY35 = 5
163     PY36 = 6
164     PY37 = 7
165     PY38 = 8
166
167     def is_python2(self) -> bool:
168         return self is TargetVersion.PY27
169
170
171 PY36_VERSIONS = {TargetVersion.PY36, TargetVersion.PY37, TargetVersion.PY38}
172
173
174 class Feature(Enum):
175     # All string literals are unicode
176     UNICODE_LITERALS = 1
177     F_STRINGS = 2
178     NUMERIC_UNDERSCORES = 3
179     TRAILING_COMMA_IN_CALL = 4
180     TRAILING_COMMA_IN_DEF = 5
181     # The following two feature-flags are mutually exclusive, and exactly one should be
182     # set for every version of python.
183     ASYNC_IDENTIFIERS = 6
184     ASYNC_KEYWORDS = 7
185     ASSIGNMENT_EXPRESSIONS = 8
186     POS_ONLY_ARGUMENTS = 9
187
188
189 VERSION_TO_FEATURES: Dict[TargetVersion, Set[Feature]] = {
190     TargetVersion.PY27: {Feature.ASYNC_IDENTIFIERS},
191     TargetVersion.PY33: {Feature.UNICODE_LITERALS, Feature.ASYNC_IDENTIFIERS},
192     TargetVersion.PY34: {Feature.UNICODE_LITERALS, Feature.ASYNC_IDENTIFIERS},
193     TargetVersion.PY35: {
194         Feature.UNICODE_LITERALS,
195         Feature.TRAILING_COMMA_IN_CALL,
196         Feature.ASYNC_IDENTIFIERS,
197     },
198     TargetVersion.PY36: {
199         Feature.UNICODE_LITERALS,
200         Feature.F_STRINGS,
201         Feature.NUMERIC_UNDERSCORES,
202         Feature.TRAILING_COMMA_IN_CALL,
203         Feature.TRAILING_COMMA_IN_DEF,
204         Feature.ASYNC_IDENTIFIERS,
205     },
206     TargetVersion.PY37: {
207         Feature.UNICODE_LITERALS,
208         Feature.F_STRINGS,
209         Feature.NUMERIC_UNDERSCORES,
210         Feature.TRAILING_COMMA_IN_CALL,
211         Feature.TRAILING_COMMA_IN_DEF,
212         Feature.ASYNC_KEYWORDS,
213     },
214     TargetVersion.PY38: {
215         Feature.UNICODE_LITERALS,
216         Feature.F_STRINGS,
217         Feature.NUMERIC_UNDERSCORES,
218         Feature.TRAILING_COMMA_IN_CALL,
219         Feature.TRAILING_COMMA_IN_DEF,
220         Feature.ASYNC_KEYWORDS,
221         Feature.ASSIGNMENT_EXPRESSIONS,
222         Feature.POS_ONLY_ARGUMENTS,
223     },
224 }
225
226
227 @dataclass
228 class Mode:
229     target_versions: Set[TargetVersion] = field(default_factory=set)
230     line_length: int = DEFAULT_LINE_LENGTH
231     string_normalization: bool = True
232     is_pyi: bool = False
233
234     def get_cache_key(self) -> str:
235         if self.target_versions:
236             version_str = ",".join(
237                 str(version.value)
238                 for version in sorted(self.target_versions, key=lambda v: v.value)
239             )
240         else:
241             version_str = "-"
242         parts = [
243             version_str,
244             str(self.line_length),
245             str(int(self.string_normalization)),
246             str(int(self.is_pyi)),
247         ]
248         return ".".join(parts)
249
250
251 # Legacy name, left for integrations.
252 FileMode = Mode
253
254
255 def supports_feature(target_versions: Set[TargetVersion], feature: Feature) -> bool:
256     return all(feature in VERSION_TO_FEATURES[version] for version in target_versions)
257
258
259 def find_pyproject_toml(path_search_start: str) -> Optional[str]:
260     """Find the absolute filepath to a pyproject.toml if it exists"""
261     path_project_root = find_project_root(path_search_start)
262     path_pyproject_toml = path_project_root / "pyproject.toml"
263     return str(path_pyproject_toml) if path_pyproject_toml.is_file() else None
264
265
266 def parse_pyproject_toml(path_config: str) -> Dict[str, Any]:
267     """Parse a pyproject toml file, pulling out relevant parts for Black
268
269     If parsing fails, will raise a toml.TomlDecodeError
270     """
271     pyproject_toml = toml.load(path_config)
272     config = pyproject_toml.get("tool", {}).get("black", {})
273     return {k.replace("--", "").replace("-", "_"): v for k, v in config.items()}
274
275
276 def read_pyproject_toml(
277     ctx: click.Context, param: click.Parameter, value: Optional[str]
278 ) -> Optional[str]:
279     """Inject Black configuration from "pyproject.toml" into defaults in `ctx`.
280
281     Returns the path to a successfully found and read configuration file, None
282     otherwise.
283     """
284     if not value:
285         value = find_pyproject_toml(ctx.params.get("src", ()))
286         if value is None:
287             return None
288
289     try:
290         config = parse_pyproject_toml(value)
291     except (toml.TomlDecodeError, OSError) as e:
292         raise click.FileError(
293             filename=value, hint=f"Error reading configuration file: {e}"
294         )
295
296     if not config:
297         return None
298
299     target_version = config.get("target_version")
300     if target_version is not None and not isinstance(target_version, list):
301         raise click.BadOptionUsage(
302             "target-version", f"Config key target-version must be a list"
303         )
304
305     default_map: Dict[str, Any] = {}
306     if ctx.default_map:
307         default_map.update(ctx.default_map)
308     default_map.update(config)
309
310     ctx.default_map = default_map
311     return value
312
313
314 def target_version_option_callback(
315     c: click.Context, p: Union[click.Option, click.Parameter], v: Tuple[str, ...]
316 ) -> List[TargetVersion]:
317     """Compute the target versions from a --target-version flag.
318
319     This is its own function because mypy couldn't infer the type correctly
320     when it was a lambda, causing mypyc trouble.
321     """
322     return [TargetVersion[val.upper()] for val in v]
323
324
325 @click.command(context_settings=dict(help_option_names=["-h", "--help"]))
326 @click.option("-c", "--code", type=str, help="Format the code passed in as a string.")
327 @click.option(
328     "-l",
329     "--line-length",
330     type=int,
331     default=DEFAULT_LINE_LENGTH,
332     help="How many characters per line to allow.",
333     show_default=True,
334 )
335 @click.option(
336     "-t",
337     "--target-version",
338     type=click.Choice([v.name.lower() for v in TargetVersion]),
339     callback=target_version_option_callback,
340     multiple=True,
341     help=(
342         "Python versions that should be supported by Black's output. [default: per-file"
343         " auto-detection]"
344     ),
345 )
346 @click.option(
347     "--py36",
348     is_flag=True,
349     help=(
350         "Allow using Python 3.6-only syntax on all input files.  This will put trailing"
351         " commas in function signatures and calls also after *args and **kwargs."
352         " Deprecated; use --target-version instead. [default: per-file auto-detection]"
353     ),
354 )
355 @click.option(
356     "--pyi",
357     is_flag=True,
358     help=(
359         "Format all input files like typing stubs regardless of file extension (useful"
360         " when piping source on standard input)."
361     ),
362 )
363 @click.option(
364     "-S",
365     "--skip-string-normalization",
366     is_flag=True,
367     help="Don't normalize string quotes or prefixes.",
368 )
369 @click.option(
370     "--check",
371     is_flag=True,
372     help=(
373         "Don't write the files back, just return the status.  Return code 0 means"
374         " nothing would change.  Return code 1 means some files would be reformatted."
375         " Return code 123 means there was an internal error."
376     ),
377 )
378 @click.option(
379     "--diff",
380     is_flag=True,
381     help="Don't write the files back, just output a diff for each file on stdout.",
382 )
383 @click.option(
384     "--fast/--safe",
385     is_flag=True,
386     help="If --fast given, skip temporary sanity checks. [default: --safe]",
387 )
388 @click.option(
389     "--include",
390     type=str,
391     default=DEFAULT_INCLUDES,
392     help=(
393         "A regular expression that matches files and directories that should be"
394         " included on recursive searches.  An empty value means all files are included"
395         " regardless of the name.  Use forward slashes for directories on all platforms"
396         " (Windows, too).  Exclusions are calculated first, inclusions later."
397     ),
398     show_default=True,
399 )
400 @click.option(
401     "--exclude",
402     type=str,
403     default=DEFAULT_EXCLUDES,
404     help=(
405         "A regular expression that matches files and directories that should be"
406         " excluded on recursive searches.  An empty value means no paths are excluded."
407         " Use forward slashes for directories on all platforms (Windows, too). "
408         " Exclusions are calculated first, inclusions later."
409     ),
410     show_default=True,
411 )
412 @click.option(
413     "-q",
414     "--quiet",
415     is_flag=True,
416     help=(
417         "Don't emit non-error messages to stderr. Errors are still emitted; silence"
418         " those with 2>/dev/null."
419     ),
420 )
421 @click.option(
422     "-v",
423     "--verbose",
424     is_flag=True,
425     help=(
426         "Also emit messages to stderr about files that were not changed or were ignored"
427         " due to --exclude=."
428     ),
429 )
430 @click.version_option(version=__version__)
431 @click.argument(
432     "src",
433     nargs=-1,
434     type=click.Path(
435         exists=True, file_okay=True, dir_okay=True, readable=True, allow_dash=True
436     ),
437     is_eager=True,
438 )
439 @click.option(
440     "--config",
441     type=click.Path(
442         exists=True,
443         file_okay=True,
444         dir_okay=False,
445         readable=True,
446         allow_dash=False,
447         path_type=str,
448     ),
449     is_eager=True,
450     callback=read_pyproject_toml,
451     help="Read configuration from PATH.",
452 )
453 @click.pass_context
454 def main(
455     ctx: click.Context,
456     code: Optional[str],
457     line_length: int,
458     target_version: List[TargetVersion],
459     check: bool,
460     diff: bool,
461     fast: bool,
462     pyi: bool,
463     py36: bool,
464     skip_string_normalization: bool,
465     quiet: bool,
466     verbose: bool,
467     include: str,
468     exclude: str,
469     src: Tuple[str, ...],
470     config: Optional[str],
471 ) -> None:
472     """The uncompromising code formatter."""
473     write_back = WriteBack.from_configuration(check=check, diff=diff)
474     if target_version:
475         if py36:
476             err("Cannot use both --target-version and --py36")
477             ctx.exit(2)
478         else:
479             versions = set(target_version)
480     elif py36:
481         err(
482             "--py36 is deprecated and will be removed in a future version. Use"
483             " --target-version py36 instead."
484         )
485         versions = PY36_VERSIONS
486     else:
487         # We'll autodetect later.
488         versions = set()
489     mode = Mode(
490         target_versions=versions,
491         line_length=line_length,
492         is_pyi=pyi,
493         string_normalization=not skip_string_normalization,
494     )
495     if config and verbose:
496         out(f"Using configuration from {config}.", bold=False, fg="blue")
497     if code is not None:
498         print(format_str(code, mode=mode))
499         ctx.exit(0)
500     try:
501         include_regex = re_compile_maybe_verbose(include)
502     except re.error:
503         err(f"Invalid regular expression for include given: {include!r}")
504         ctx.exit(2)
505     try:
506         exclude_regex = re_compile_maybe_verbose(exclude)
507     except re.error:
508         err(f"Invalid regular expression for exclude given: {exclude!r}")
509         ctx.exit(2)
510     report = Report(check=check, diff=diff, quiet=quiet, verbose=verbose)
511     root = find_project_root(src)
512     sources: Set[Path] = set()
513     path_empty(src, quiet, verbose, ctx)
514     for s in src:
515         p = Path(s)
516         if p.is_dir():
517             sources.update(
518                 gen_python_files_in_dir(
519                     p, root, include_regex, exclude_regex, report, get_gitignore(root)
520                 )
521             )
522         elif p.is_file() or s == "-":
523             # if a file was explicitly given, we don't care about its extension
524             sources.add(p)
525         else:
526             err(f"invalid path: {s}")
527     if len(sources) == 0:
528         if verbose or not quiet:
529             out("No Python files are present to be formatted. Nothing to do 😴")
530         ctx.exit(0)
531
532     if len(sources) == 1:
533         reformat_one(
534             src=sources.pop(),
535             fast=fast,
536             write_back=write_back,
537             mode=mode,
538             report=report,
539         )
540     else:
541         reformat_many(
542             sources=sources, fast=fast, write_back=write_back, mode=mode, report=report
543         )
544
545     if verbose or not quiet:
546         out("Oh no! 💥 💔 💥" if report.return_code else "All done! ✨ 🍰 ✨")
547         click.secho(str(report), err=True)
548     ctx.exit(report.return_code)
549
550
551 def path_empty(
552     src: Tuple[str, ...], quiet: bool, verbose: bool, ctx: click.Context
553 ) -> None:
554     """
555     Exit if there is no `src` provided for formatting
556     """
557     if not src:
558         if verbose or not quiet:
559             out("No Path provided. Nothing to do 😴")
560             ctx.exit(0)
561
562
563 def reformat_one(
564     src: Path, fast: bool, write_back: WriteBack, mode: Mode, report: "Report"
565 ) -> None:
566     """Reformat a single file under `src` without spawning child processes.
567
568     `fast`, `write_back`, and `mode` options are passed to
569     :func:`format_file_in_place` or :func:`format_stdin_to_stdout`.
570     """
571     try:
572         changed = Changed.NO
573         if not src.is_file() and str(src) == "-":
574             if format_stdin_to_stdout(fast=fast, write_back=write_back, mode=mode):
575                 changed = Changed.YES
576         else:
577             cache: Cache = {}
578             if write_back != WriteBack.DIFF:
579                 cache = read_cache(mode)
580                 res_src = src.resolve()
581                 if res_src in cache and cache[res_src] == get_cache_info(res_src):
582                     changed = Changed.CACHED
583             if changed is not Changed.CACHED and format_file_in_place(
584                 src, fast=fast, write_back=write_back, mode=mode
585             ):
586                 changed = Changed.YES
587             if (write_back is WriteBack.YES and changed is not Changed.CACHED) or (
588                 write_back is WriteBack.CHECK and changed is Changed.NO
589             ):
590                 write_cache(cache, [src], mode)
591         report.done(src, changed)
592     except Exception as exc:
593         report.failed(src, str(exc))
594
595
596 def reformat_many(
597     sources: Set[Path], fast: bool, write_back: WriteBack, mode: Mode, report: "Report"
598 ) -> None:
599     """Reformat multiple files using a ProcessPoolExecutor."""
600     loop = asyncio.get_event_loop()
601     worker_count = os.cpu_count()
602     if sys.platform == "win32":
603         # Work around https://bugs.python.org/issue26903
604         worker_count = min(worker_count, 61)
605     executor = ProcessPoolExecutor(max_workers=worker_count)
606     try:
607         loop.run_until_complete(
608             schedule_formatting(
609                 sources=sources,
610                 fast=fast,
611                 write_back=write_back,
612                 mode=mode,
613                 report=report,
614                 loop=loop,
615                 executor=executor,
616             )
617         )
618     finally:
619         shutdown(loop)
620         executor.shutdown()
621
622
623 async def schedule_formatting(
624     sources: Set[Path],
625     fast: bool,
626     write_back: WriteBack,
627     mode: Mode,
628     report: "Report",
629     loop: asyncio.AbstractEventLoop,
630     executor: Executor,
631 ) -> None:
632     """Run formatting of `sources` in parallel using the provided `executor`.
633
634     (Use ProcessPoolExecutors for actual parallelism.)
635
636     `write_back`, `fast`, and `mode` options are passed to
637     :func:`format_file_in_place`.
638     """
639     cache: Cache = {}
640     if write_back != WriteBack.DIFF:
641         cache = read_cache(mode)
642         sources, cached = filter_cached(cache, sources)
643         for src in sorted(cached):
644             report.done(src, Changed.CACHED)
645     if not sources:
646         return
647
648     cancelled = []
649     sources_to_cache = []
650     lock = None
651     if write_back == WriteBack.DIFF:
652         # For diff output, we need locks to ensure we don't interleave output
653         # from different processes.
654         manager = Manager()
655         lock = manager.Lock()
656     tasks = {
657         asyncio.ensure_future(
658             loop.run_in_executor(
659                 executor, format_file_in_place, src, fast, mode, write_back, lock
660             )
661         ): src
662         for src in sorted(sources)
663     }
664     pending: Iterable["asyncio.Future[bool]"] = tasks.keys()
665     try:
666         loop.add_signal_handler(signal.SIGINT, cancel, pending)
667         loop.add_signal_handler(signal.SIGTERM, cancel, pending)
668     except NotImplementedError:
669         # There are no good alternatives for these on Windows.
670         pass
671     while pending:
672         done, _ = await asyncio.wait(pending, return_when=asyncio.FIRST_COMPLETED)
673         for task in done:
674             src = tasks.pop(task)
675             if task.cancelled():
676                 cancelled.append(task)
677             elif task.exception():
678                 report.failed(src, str(task.exception()))
679             else:
680                 changed = Changed.YES if task.result() else Changed.NO
681                 # If the file was written back or was successfully checked as
682                 # well-formatted, store this information in the cache.
683                 if write_back is WriteBack.YES or (
684                     write_back is WriteBack.CHECK and changed is Changed.NO
685                 ):
686                     sources_to_cache.append(src)
687                 report.done(src, changed)
688     if cancelled:
689         await asyncio.gather(*cancelled, loop=loop, return_exceptions=True)
690     if sources_to_cache:
691         write_cache(cache, sources_to_cache, mode)
692
693
694 def format_file_in_place(
695     src: Path,
696     fast: bool,
697     mode: Mode,
698     write_back: WriteBack = WriteBack.NO,
699     lock: Any = None,  # multiprocessing.Manager().Lock() is some crazy proxy
700 ) -> bool:
701     """Format file under `src` path. Return True if changed.
702
703     If `write_back` is DIFF, write a diff to stdout. If it is YES, write reformatted
704     code to the file.
705     `mode` and `fast` options are passed to :func:`format_file_contents`.
706     """
707     if src.suffix == ".pyi":
708         mode = replace(mode, is_pyi=True)
709
710     then = datetime.utcfromtimestamp(src.stat().st_mtime)
711     with open(src, "rb") as buf:
712         src_contents, encoding, newline = decode_bytes(buf.read())
713     try:
714         dst_contents = format_file_contents(src_contents, fast=fast, mode=mode)
715     except NothingChanged:
716         return False
717
718     if write_back == WriteBack.YES:
719         with open(src, "w", encoding=encoding, newline=newline) as f:
720             f.write(dst_contents)
721     elif write_back == WriteBack.DIFF:
722         now = datetime.utcnow()
723         src_name = f"{src}\t{then} +0000"
724         dst_name = f"{src}\t{now} +0000"
725         diff_contents = diff(src_contents, dst_contents, src_name, dst_name)
726
727         with lock or nullcontext():
728             f = io.TextIOWrapper(
729                 sys.stdout.buffer,
730                 encoding=encoding,
731                 newline=newline,
732                 write_through=True,
733             )
734             f.write(diff_contents)
735             f.detach()
736
737     return True
738
739
740 def format_stdin_to_stdout(
741     fast: bool, *, write_back: WriteBack = WriteBack.NO, mode: Mode
742 ) -> bool:
743     """Format file on stdin. Return True if changed.
744
745     If `write_back` is YES, write reformatted code back to stdout. If it is DIFF,
746     write a diff to stdout. The `mode` argument is passed to
747     :func:`format_file_contents`.
748     """
749     then = datetime.utcnow()
750     src, encoding, newline = decode_bytes(sys.stdin.buffer.read())
751     dst = src
752     try:
753         dst = format_file_contents(src, fast=fast, mode=mode)
754         return True
755
756     except NothingChanged:
757         return False
758
759     finally:
760         f = io.TextIOWrapper(
761             sys.stdout.buffer, encoding=encoding, newline=newline, write_through=True
762         )
763         if write_back == WriteBack.YES:
764             f.write(dst)
765         elif write_back == WriteBack.DIFF:
766             now = datetime.utcnow()
767             src_name = f"STDIN\t{then} +0000"
768             dst_name = f"STDOUT\t{now} +0000"
769             f.write(diff(src, dst, src_name, dst_name))
770         f.detach()
771
772
773 def format_file_contents(src_contents: str, *, fast: bool, mode: Mode) -> FileContent:
774     """Reformat contents a file and return new contents.
775
776     If `fast` is False, additionally confirm that the reformatted code is
777     valid by calling :func:`assert_equivalent` and :func:`assert_stable` on it.
778     `mode` is passed to :func:`format_str`.
779     """
780     if src_contents.strip() == "":
781         raise NothingChanged
782
783     dst_contents = format_str(src_contents, mode=mode)
784     if src_contents == dst_contents:
785         raise NothingChanged
786
787     if not fast:
788         assert_equivalent(src_contents, dst_contents)
789         assert_stable(src_contents, dst_contents, mode=mode)
790     return dst_contents
791
792
793 def format_str(src_contents: str, *, mode: Mode) -> FileContent:
794     """Reformat a string and return new contents.
795
796     `mode` determines formatting options, such as how many characters per line are
797     allowed.  Example:
798
799     >>> import black
800     >>> print(black.format_str("def f(arg:str='')->None:...", mode=Mode()))
801     def f(arg: str = "") -> None:
802         ...
803
804     A more complex example:
805     >>> print(
806     ...   black.format_str(
807     ...     "def f(arg:str='')->None: hey",
808     ...     mode=black.Mode(
809     ...       target_versions={black.TargetVersion.PY36},
810     ...       line_length=10,
811     ...       string_normalization=False,
812     ...       is_pyi=False,
813     ...     ),
814     ...   ),
815     ... )
816     def f(
817         arg: str = '',
818     ) -> None:
819         hey
820
821     """
822     src_node = lib2to3_parse(src_contents.lstrip(), mode.target_versions)
823     dst_contents = []
824     future_imports = get_future_imports(src_node)
825     if mode.target_versions:
826         versions = mode.target_versions
827     else:
828         versions = detect_target_versions(src_node)
829     normalize_fmt_off(src_node)
830     lines = LineGenerator(
831         remove_u_prefix="unicode_literals" in future_imports
832         or supports_feature(versions, Feature.UNICODE_LITERALS),
833         is_pyi=mode.is_pyi,
834         normalize_strings=mode.string_normalization,
835     )
836     elt = EmptyLineTracker(is_pyi=mode.is_pyi)
837     empty_line = Line()
838     after = 0
839     split_line_features = {
840         feature
841         for feature in {Feature.TRAILING_COMMA_IN_CALL, Feature.TRAILING_COMMA_IN_DEF}
842         if supports_feature(versions, feature)
843     }
844     for current_line in lines.visit(src_node):
845         dst_contents.append(str(empty_line) * after)
846         before, after = elt.maybe_empty_lines(current_line)
847         dst_contents.append(str(empty_line) * before)
848         for line in transform_line(
849             current_line,
850             line_length=mode.line_length,
851             normalize_strings=mode.string_normalization,
852             features=split_line_features,
853         ):
854             dst_contents.append(str(line))
855     return "".join(dst_contents)
856
857
858 def decode_bytes(src: bytes) -> Tuple[FileContent, Encoding, NewLine]:
859     """Return a tuple of (decoded_contents, encoding, newline).
860
861     `newline` is either CRLF or LF but `decoded_contents` is decoded with
862     universal newlines (i.e. only contains LF).
863     """
864     srcbuf = io.BytesIO(src)
865     encoding, lines = tokenize.detect_encoding(srcbuf.readline)
866     if not lines:
867         return "", encoding, "\n"
868
869     newline = "\r\n" if b"\r\n" == lines[0][-2:] else "\n"
870     srcbuf.seek(0)
871     with io.TextIOWrapper(srcbuf, encoding) as tiow:
872         return tiow.read(), encoding, newline
873
874
875 def get_grammars(target_versions: Set[TargetVersion]) -> List[Grammar]:
876     if not target_versions:
877         # No target_version specified, so try all grammars.
878         return [
879             # Python 3.7+
880             pygram.python_grammar_no_print_statement_no_exec_statement_async_keywords,
881             # Python 3.0-3.6
882             pygram.python_grammar_no_print_statement_no_exec_statement,
883             # Python 2.7 with future print_function import
884             pygram.python_grammar_no_print_statement,
885             # Python 2.7
886             pygram.python_grammar,
887         ]
888
889     if all(version.is_python2() for version in target_versions):
890         # Python 2-only code, so try Python 2 grammars.
891         return [
892             # Python 2.7 with future print_function import
893             pygram.python_grammar_no_print_statement,
894             # Python 2.7
895             pygram.python_grammar,
896         ]
897
898     # Python 3-compatible code, so only try Python 3 grammar.
899     grammars = []
900     # If we have to parse both, try to parse async as a keyword first
901     if not supports_feature(target_versions, Feature.ASYNC_IDENTIFIERS):
902         # Python 3.7+
903         grammars.append(
904             pygram.python_grammar_no_print_statement_no_exec_statement_async_keywords
905         )
906     if not supports_feature(target_versions, Feature.ASYNC_KEYWORDS):
907         # Python 3.0-3.6
908         grammars.append(pygram.python_grammar_no_print_statement_no_exec_statement)
909     # At least one of the above branches must have been taken, because every Python
910     # version has exactly one of the two 'ASYNC_*' flags
911     return grammars
912
913
914 def lib2to3_parse(src_txt: str, target_versions: Iterable[TargetVersion] = ()) -> Node:
915     """Given a string with source, return the lib2to3 Node."""
916     if src_txt[-1:] != "\n":
917         src_txt += "\n"
918
919     for grammar in get_grammars(set(target_versions)):
920         drv = driver.Driver(grammar, pytree.convert)
921         try:
922             result = drv.parse_string(src_txt, True)
923             break
924
925         except ParseError as pe:
926             lineno, column = pe.context[1]
927             lines = src_txt.splitlines()
928             try:
929                 faulty_line = lines[lineno - 1]
930             except IndexError:
931                 faulty_line = "<line number missing in source>"
932             exc = InvalidInput(f"Cannot parse: {lineno}:{column}: {faulty_line}")
933     else:
934         raise exc from None
935
936     if isinstance(result, Leaf):
937         result = Node(syms.file_input, [result])
938     return result
939
940
941 def lib2to3_unparse(node: Node) -> str:
942     """Given a lib2to3 node, return its string representation."""
943     code = str(node)
944     return code
945
946
947 class Visitor(Generic[T]):
948     """Basic lib2to3 visitor that yields things of type `T` on `visit()`."""
949
950     def visit(self, node: LN) -> Iterator[T]:
951         """Main method to visit `node` and its children.
952
953         It tries to find a `visit_*()` method for the given `node.type`, like
954         `visit_simple_stmt` for Node objects or `visit_INDENT` for Leaf objects.
955         If no dedicated `visit_*()` method is found, chooses `visit_default()`
956         instead.
957
958         Then yields objects of type `T` from the selected visitor.
959         """
960         if node.type < 256:
961             name = token.tok_name[node.type]
962         else:
963             name = str(type_repr(node.type))
964         # We explicitly branch on whether a visitor exists (instead of
965         # using self.visit_default as the default arg to getattr) in order
966         # to save needing to create a bound method object and so mypyc can
967         # generate a native call to visit_default.
968         visitf = getattr(self, f"visit_{name}", None)
969         if visitf:
970             yield from visitf(node)
971         else:
972             yield from self.visit_default(node)
973
974     def visit_default(self, node: LN) -> Iterator[T]:
975         """Default `visit_*()` implementation. Recurses to children of `node`."""
976         if isinstance(node, Node):
977             for child in node.children:
978                 yield from self.visit(child)
979
980
981 @dataclass
982 class DebugVisitor(Visitor[T]):
983     tree_depth: int = 0
984
985     def visit_default(self, node: LN) -> Iterator[T]:
986         indent = " " * (2 * self.tree_depth)
987         if isinstance(node, Node):
988             _type = type_repr(node.type)
989             out(f"{indent}{_type}", fg="yellow")
990             self.tree_depth += 1
991             for child in node.children:
992                 yield from self.visit(child)
993
994             self.tree_depth -= 1
995             out(f"{indent}/{_type}", fg="yellow", bold=False)
996         else:
997             _type = token.tok_name.get(node.type, str(node.type))
998             out(f"{indent}{_type}", fg="blue", nl=False)
999             if node.prefix:
1000                 # We don't have to handle prefixes for `Node` objects since
1001                 # that delegates to the first child anyway.
1002                 out(f" {node.prefix!r}", fg="green", bold=False, nl=False)
1003             out(f" {node.value!r}", fg="blue", bold=False)
1004
1005     @classmethod
1006     def show(cls, code: Union[str, Leaf, Node]) -> None:
1007         """Pretty-print the lib2to3 AST of a given string of `code`.
1008
1009         Convenience method for debugging.
1010         """
1011         v: DebugVisitor[None] = DebugVisitor()
1012         if isinstance(code, str):
1013             code = lib2to3_parse(code)
1014         list(v.visit(code))
1015
1016
1017 WHITESPACE: Final = {token.DEDENT, token.INDENT, token.NEWLINE}
1018 STATEMENT: Final = {
1019     syms.if_stmt,
1020     syms.while_stmt,
1021     syms.for_stmt,
1022     syms.try_stmt,
1023     syms.except_clause,
1024     syms.with_stmt,
1025     syms.funcdef,
1026     syms.classdef,
1027 }
1028 STANDALONE_COMMENT: Final = 153
1029 token.tok_name[STANDALONE_COMMENT] = "STANDALONE_COMMENT"
1030 LOGIC_OPERATORS: Final = {"and", "or"}
1031 COMPARATORS: Final = {
1032     token.LESS,
1033     token.GREATER,
1034     token.EQEQUAL,
1035     token.NOTEQUAL,
1036     token.LESSEQUAL,
1037     token.GREATEREQUAL,
1038 }
1039 MATH_OPERATORS: Final = {
1040     token.VBAR,
1041     token.CIRCUMFLEX,
1042     token.AMPER,
1043     token.LEFTSHIFT,
1044     token.RIGHTSHIFT,
1045     token.PLUS,
1046     token.MINUS,
1047     token.STAR,
1048     token.SLASH,
1049     token.DOUBLESLASH,
1050     token.PERCENT,
1051     token.AT,
1052     token.TILDE,
1053     token.DOUBLESTAR,
1054 }
1055 STARS: Final = {token.STAR, token.DOUBLESTAR}
1056 VARARGS_SPECIALS: Final = STARS | {token.SLASH}
1057 VARARGS_PARENTS: Final = {
1058     syms.arglist,
1059     syms.argument,  # double star in arglist
1060     syms.trailer,  # single argument to call
1061     syms.typedargslist,
1062     syms.varargslist,  # lambdas
1063 }
1064 UNPACKING_PARENTS: Final = {
1065     syms.atom,  # single element of a list or set literal
1066     syms.dictsetmaker,
1067     syms.listmaker,
1068     syms.testlist_gexp,
1069     syms.testlist_star_expr,
1070 }
1071 TEST_DESCENDANTS: Final = {
1072     syms.test,
1073     syms.lambdef,
1074     syms.or_test,
1075     syms.and_test,
1076     syms.not_test,
1077     syms.comparison,
1078     syms.star_expr,
1079     syms.expr,
1080     syms.xor_expr,
1081     syms.and_expr,
1082     syms.shift_expr,
1083     syms.arith_expr,
1084     syms.trailer,
1085     syms.term,
1086     syms.power,
1087 }
1088 ASSIGNMENTS: Final = {
1089     "=",
1090     "+=",
1091     "-=",
1092     "*=",
1093     "@=",
1094     "/=",
1095     "%=",
1096     "&=",
1097     "|=",
1098     "^=",
1099     "<<=",
1100     ">>=",
1101     "**=",
1102     "//=",
1103 }
1104 COMPREHENSION_PRIORITY: Final = 20
1105 COMMA_PRIORITY: Final = 18
1106 TERNARY_PRIORITY: Final = 16
1107 LOGIC_PRIORITY: Final = 14
1108 STRING_PRIORITY: Final = 12
1109 COMPARATOR_PRIORITY: Final = 10
1110 MATH_PRIORITIES: Final = {
1111     token.VBAR: 9,
1112     token.CIRCUMFLEX: 8,
1113     token.AMPER: 7,
1114     token.LEFTSHIFT: 6,
1115     token.RIGHTSHIFT: 6,
1116     token.PLUS: 5,
1117     token.MINUS: 5,
1118     token.STAR: 4,
1119     token.SLASH: 4,
1120     token.DOUBLESLASH: 4,
1121     token.PERCENT: 4,
1122     token.AT: 4,
1123     token.TILDE: 3,
1124     token.DOUBLESTAR: 2,
1125 }
1126 DOT_PRIORITY: Final = 1
1127
1128
1129 @dataclass
1130 class BracketTracker:
1131     """Keeps track of brackets on a line."""
1132
1133     depth: int = 0
1134     bracket_match: Dict[Tuple[Depth, NodeType], Leaf] = field(default_factory=dict)
1135     delimiters: Dict[LeafID, Priority] = field(default_factory=dict)
1136     previous: Optional[Leaf] = None
1137     _for_loop_depths: List[int] = field(default_factory=list)
1138     _lambda_argument_depths: List[int] = field(default_factory=list)
1139
1140     def mark(self, leaf: Leaf) -> None:
1141         """Mark `leaf` with bracket-related metadata. Keep track of delimiters.
1142
1143         All leaves receive an int `bracket_depth` field that stores how deep
1144         within brackets a given leaf is. 0 means there are no enclosing brackets
1145         that started on this line.
1146
1147         If a leaf is itself a closing bracket, it receives an `opening_bracket`
1148         field that it forms a pair with. This is a one-directional link to
1149         avoid reference cycles.
1150
1151         If a leaf is a delimiter (a token on which Black can split the line if
1152         needed) and it's on depth 0, its `id()` is stored in the tracker's
1153         `delimiters` field.
1154         """
1155         if leaf.type == token.COMMENT:
1156             return
1157
1158         self.maybe_decrement_after_for_loop_variable(leaf)
1159         self.maybe_decrement_after_lambda_arguments(leaf)
1160         if leaf.type in CLOSING_BRACKETS:
1161             self.depth -= 1
1162             opening_bracket = self.bracket_match.pop((self.depth, leaf.type))
1163             leaf.opening_bracket = opening_bracket
1164         leaf.bracket_depth = self.depth
1165         if self.depth == 0:
1166             delim = is_split_before_delimiter(leaf, self.previous)
1167             if delim and self.previous is not None:
1168                 self.delimiters[id(self.previous)] = delim
1169             else:
1170                 delim = is_split_after_delimiter(leaf, self.previous)
1171                 if delim:
1172                     self.delimiters[id(leaf)] = delim
1173         if leaf.type in OPENING_BRACKETS:
1174             self.bracket_match[self.depth, BRACKET[leaf.type]] = leaf
1175             self.depth += 1
1176         self.previous = leaf
1177         self.maybe_increment_lambda_arguments(leaf)
1178         self.maybe_increment_for_loop_variable(leaf)
1179
1180     def any_open_brackets(self) -> bool:
1181         """Return True if there is an yet unmatched open bracket on the line."""
1182         return bool(self.bracket_match)
1183
1184     def max_delimiter_priority(self, exclude: Iterable[LeafID] = ()) -> Priority:
1185         """Return the highest priority of a delimiter found on the line.
1186
1187         Values are consistent with what `is_split_*_delimiter()` return.
1188         Raises ValueError on no delimiters.
1189         """
1190         return max(v for k, v in self.delimiters.items() if k not in exclude)
1191
1192     def delimiter_count_with_priority(self, priority: Priority = 0) -> int:
1193         """Return the number of delimiters with the given `priority`.
1194
1195         If no `priority` is passed, defaults to max priority on the line.
1196         """
1197         if not self.delimiters:
1198             return 0
1199
1200         priority = priority or self.max_delimiter_priority()
1201         return sum(1 for p in self.delimiters.values() if p == priority)
1202
1203     def maybe_increment_for_loop_variable(self, leaf: Leaf) -> bool:
1204         """In a for loop, or comprehension, the variables are often unpacks.
1205
1206         To avoid splitting on the comma in this situation, increase the depth of
1207         tokens between `for` and `in`.
1208         """
1209         if leaf.type == token.NAME and leaf.value == "for":
1210             self.depth += 1
1211             self._for_loop_depths.append(self.depth)
1212             return True
1213
1214         return False
1215
1216     def maybe_decrement_after_for_loop_variable(self, leaf: Leaf) -> bool:
1217         """See `maybe_increment_for_loop_variable` above for explanation."""
1218         if (
1219             self._for_loop_depths
1220             and self._for_loop_depths[-1] == self.depth
1221             and leaf.type == token.NAME
1222             and leaf.value == "in"
1223         ):
1224             self.depth -= 1
1225             self._for_loop_depths.pop()
1226             return True
1227
1228         return False
1229
1230     def maybe_increment_lambda_arguments(self, leaf: Leaf) -> bool:
1231         """In a lambda expression, there might be more than one argument.
1232
1233         To avoid splitting on the comma in this situation, increase the depth of
1234         tokens between `lambda` and `:`.
1235         """
1236         if leaf.type == token.NAME and leaf.value == "lambda":
1237             self.depth += 1
1238             self._lambda_argument_depths.append(self.depth)
1239             return True
1240
1241         return False
1242
1243     def maybe_decrement_after_lambda_arguments(self, leaf: Leaf) -> bool:
1244         """See `maybe_increment_lambda_arguments` above for explanation."""
1245         if (
1246             self._lambda_argument_depths
1247             and self._lambda_argument_depths[-1] == self.depth
1248             and leaf.type == token.COLON
1249         ):
1250             self.depth -= 1
1251             self._lambda_argument_depths.pop()
1252             return True
1253
1254         return False
1255
1256     def get_open_lsqb(self) -> Optional[Leaf]:
1257         """Return the most recent opening square bracket (if any)."""
1258         return self.bracket_match.get((self.depth - 1, token.RSQB))
1259
1260
1261 @dataclass
1262 class Line:
1263     """Holds leaves and comments. Can be printed with `str(line)`."""
1264
1265     depth: int = 0
1266     leaves: List[Leaf] = field(default_factory=list)
1267     # keys ordered like `leaves`
1268     comments: Dict[LeafID, List[Leaf]] = field(default_factory=dict)
1269     bracket_tracker: BracketTracker = field(default_factory=BracketTracker)
1270     inside_brackets: bool = False
1271     should_explode: bool = False
1272
1273     def append(self, leaf: Leaf, preformatted: bool = False) -> None:
1274         """Add a new `leaf` to the end of the line.
1275
1276         Unless `preformatted` is True, the `leaf` will receive a new consistent
1277         whitespace prefix and metadata applied by :class:`BracketTracker`.
1278         Trailing commas are maybe removed, unpacked for loop variables are
1279         demoted from being delimiters.
1280
1281         Inline comments are put aside.
1282         """
1283         has_value = leaf.type in BRACKETS or bool(leaf.value.strip())
1284         if not has_value:
1285             return
1286
1287         if token.COLON == leaf.type and self.is_class_paren_empty:
1288             del self.leaves[-2:]
1289         if self.leaves and not preformatted:
1290             # Note: at this point leaf.prefix should be empty except for
1291             # imports, for which we only preserve newlines.
1292             leaf.prefix += whitespace(
1293                 leaf, complex_subscript=self.is_complex_subscript(leaf)
1294             )
1295         if self.inside_brackets or not preformatted:
1296             self.bracket_tracker.mark(leaf)
1297             self.maybe_remove_trailing_comma(leaf)
1298         if not self.append_comment(leaf):
1299             self.leaves.append(leaf)
1300
1301     def append_safe(self, leaf: Leaf, preformatted: bool = False) -> None:
1302         """Like :func:`append()` but disallow invalid standalone comment structure.
1303
1304         Raises ValueError when any `leaf` is appended after a standalone comment
1305         or when a standalone comment is not the first leaf on the line.
1306         """
1307         if self.bracket_tracker.depth == 0:
1308             if self.is_comment:
1309                 raise ValueError("cannot append to standalone comments")
1310
1311             if self.leaves and leaf.type == STANDALONE_COMMENT:
1312                 raise ValueError(
1313                     "cannot append standalone comments to a populated line"
1314                 )
1315
1316         self.append(leaf, preformatted=preformatted)
1317
1318     @property
1319     def is_comment(self) -> bool:
1320         """Is this line a standalone comment?"""
1321         return len(self.leaves) == 1 and self.leaves[0].type == STANDALONE_COMMENT
1322
1323     @property
1324     def is_decorator(self) -> bool:
1325         """Is this line a decorator?"""
1326         return bool(self) and self.leaves[0].type == token.AT
1327
1328     @property
1329     def is_import(self) -> bool:
1330         """Is this an import line?"""
1331         return bool(self) and is_import(self.leaves[0])
1332
1333     @property
1334     def is_class(self) -> bool:
1335         """Is this line a class definition?"""
1336         return (
1337             bool(self)
1338             and self.leaves[0].type == token.NAME
1339             and self.leaves[0].value == "class"
1340         )
1341
1342     @property
1343     def is_stub_class(self) -> bool:
1344         """Is this line a class definition with a body consisting only of "..."?"""
1345         return self.is_class and self.leaves[-3:] == [
1346             Leaf(token.DOT, ".") for _ in range(3)
1347         ]
1348
1349     @property
1350     def is_collection_with_optional_trailing_comma(self) -> bool:
1351         """Is this line a collection literal with a trailing comma that's optional?
1352
1353         Note that the trailing comma in a 1-tuple is not optional.
1354         """
1355         if not self.leaves or len(self.leaves) < 4:
1356             return False
1357
1358         # Look for and address a trailing colon.
1359         if self.leaves[-1].type == token.COLON:
1360             closer = self.leaves[-2]
1361             close_index = -2
1362         else:
1363             closer = self.leaves[-1]
1364             close_index = -1
1365         if closer.type not in CLOSING_BRACKETS or self.inside_brackets:
1366             return False
1367
1368         if closer.type == token.RPAR:
1369             # Tuples require an extra check, because if there's only
1370             # one element in the tuple removing the comma unmakes the
1371             # tuple.
1372             #
1373             # We also check for parens before looking for the trailing
1374             # comma because in some cases (eg assigning a dict
1375             # literal) the literal gets wrapped in temporary parens
1376             # during parsing. This case is covered by the
1377             # collections.py test data.
1378             opener = closer.opening_bracket
1379             for _open_index, leaf in enumerate(self.leaves):
1380                 if leaf is opener:
1381                     break
1382
1383             else:
1384                 # Couldn't find the matching opening paren, play it safe.
1385                 return False
1386
1387             commas = 0
1388             comma_depth = self.leaves[close_index - 1].bracket_depth
1389             for leaf in self.leaves[_open_index + 1 : close_index]:
1390                 if leaf.bracket_depth == comma_depth and leaf.type == token.COMMA:
1391                     commas += 1
1392             if commas > 1:
1393                 # We haven't looked yet for the trailing comma because
1394                 # we might also have caught noop parens.
1395                 return self.leaves[close_index - 1].type == token.COMMA
1396
1397             elif commas == 1:
1398                 return False  # it's either a one-tuple or didn't have a trailing comma
1399
1400             if self.leaves[close_index - 1].type in CLOSING_BRACKETS:
1401                 close_index -= 1
1402                 closer = self.leaves[close_index]
1403                 if closer.type == token.RPAR:
1404                     # TODO: this is a gut feeling. Will we ever see this?
1405                     return False
1406
1407         if self.leaves[close_index - 1].type != token.COMMA:
1408             return False
1409
1410         return True
1411
1412     @property
1413     def is_def(self) -> bool:
1414         """Is this a function definition? (Also returns True for async defs.)"""
1415         try:
1416             first_leaf = self.leaves[0]
1417         except IndexError:
1418             return False
1419
1420         try:
1421             second_leaf: Optional[Leaf] = self.leaves[1]
1422         except IndexError:
1423             second_leaf = None
1424         return (first_leaf.type == token.NAME and first_leaf.value == "def") or (
1425             first_leaf.type == token.ASYNC
1426             and second_leaf is not None
1427             and second_leaf.type == token.NAME
1428             and second_leaf.value == "def"
1429         )
1430
1431     @property
1432     def is_class_paren_empty(self) -> bool:
1433         """Is this a class with no base classes but using parentheses?
1434
1435         Those are unnecessary and should be removed.
1436         """
1437         return (
1438             bool(self)
1439             and len(self.leaves) == 4
1440             and self.is_class
1441             and self.leaves[2].type == token.LPAR
1442             and self.leaves[2].value == "("
1443             and self.leaves[3].type == token.RPAR
1444             and self.leaves[3].value == ")"
1445         )
1446
1447     @property
1448     def is_triple_quoted_string(self) -> bool:
1449         """Is the line a triple quoted string?"""
1450         return (
1451             bool(self)
1452             and self.leaves[0].type == token.STRING
1453             and self.leaves[0].value.startswith(('"""', "'''"))
1454         )
1455
1456     def contains_standalone_comments(self, depth_limit: int = sys.maxsize) -> bool:
1457         """If so, needs to be split before emitting."""
1458         for leaf in self.leaves:
1459             if leaf.type == STANDALONE_COMMENT and leaf.bracket_depth <= depth_limit:
1460                 return True
1461
1462         return False
1463
1464     def contains_uncollapsable_type_comments(self) -> bool:
1465         ignored_ids = set()
1466         try:
1467             last_leaf = self.leaves[-1]
1468             ignored_ids.add(id(last_leaf))
1469             if last_leaf.type == token.COMMA or (
1470                 last_leaf.type == token.RPAR and not last_leaf.value
1471             ):
1472                 # When trailing commas or optional parens are inserted by Black for
1473                 # consistency, comments after the previous last element are not moved
1474                 # (they don't have to, rendering will still be correct).  So we ignore
1475                 # trailing commas and invisible.
1476                 last_leaf = self.leaves[-2]
1477                 ignored_ids.add(id(last_leaf))
1478         except IndexError:
1479             return False
1480
1481         # A type comment is uncollapsable if it is attached to a leaf
1482         # that isn't at the end of the line (since that could cause it
1483         # to get associated to a different argument) or if there are
1484         # comments before it (since that could cause it to get hidden
1485         # behind a comment.
1486         comment_seen = False
1487         for leaf_id, comments in self.comments.items():
1488             for comment in comments:
1489                 if is_type_comment(comment):
1490                     if comment_seen or (
1491                         not is_type_comment(comment, " ignore")
1492                         and leaf_id not in ignored_ids
1493                     ):
1494                         return True
1495
1496                 comment_seen = True
1497
1498         return False
1499
1500     def contains_unsplittable_type_ignore(self) -> bool:
1501         if not self.leaves:
1502             return False
1503
1504         # If a 'type: ignore' is attached to the end of a line, we
1505         # can't split the line, because we can't know which of the
1506         # subexpressions the ignore was meant to apply to.
1507         #
1508         # We only want this to apply to actual physical lines from the
1509         # original source, though: we don't want the presence of a
1510         # 'type: ignore' at the end of a multiline expression to
1511         # justify pushing it all onto one line. Thus we
1512         # (unfortunately) need to check the actual source lines and
1513         # only report an unsplittable 'type: ignore' if this line was
1514         # one line in the original code.
1515
1516         # Grab the first and last line numbers, skipping generated leaves
1517         first_line = next((l.lineno for l in self.leaves if l.lineno != 0), 0)
1518         last_line = next((l.lineno for l in reversed(self.leaves) if l.lineno != 0), 0)
1519
1520         if first_line == last_line:
1521             # We look at the last two leaves since a comma or an
1522             # invisible paren could have been added at the end of the
1523             # line.
1524             for node in self.leaves[-2:]:
1525                 for comment in self.comments.get(id(node), []):
1526                     if is_type_comment(comment, " ignore"):
1527                         return True
1528
1529         return False
1530
1531     def contains_multiline_strings(self) -> bool:
1532         return any(is_multiline_string(leaf) for leaf in self.leaves)
1533
1534     def maybe_remove_trailing_comma(self, closing: Leaf) -> bool:
1535         """Remove trailing comma if there is one and it's safe."""
1536         if not (self.leaves and self.leaves[-1].type == token.COMMA):
1537             return False
1538
1539         # We remove trailing commas only in the case of importing a
1540         # single name from a module.
1541         if not (
1542             self.leaves
1543             and self.is_import
1544             and len(self.leaves) > 4
1545             and self.leaves[-1].type == token.COMMA
1546             and closing.type in CLOSING_BRACKETS
1547             and self.leaves[-4].type == token.NAME
1548             and (
1549                 # regular `from foo import bar,`
1550                 self.leaves[-4].value == "import"
1551                 # `from foo import (bar as baz,)
1552                 or (
1553                     len(self.leaves) > 6
1554                     and self.leaves[-6].value == "import"
1555                     and self.leaves[-3].value == "as"
1556                 )
1557                 # `from foo import bar as baz,`
1558                 or (
1559                     len(self.leaves) > 5
1560                     and self.leaves[-5].value == "import"
1561                     and self.leaves[-3].value == "as"
1562                 )
1563             )
1564             and closing.type == token.RPAR
1565         ):
1566             return False
1567
1568         self.remove_trailing_comma()
1569         return True
1570
1571     def append_comment(self, comment: Leaf) -> bool:
1572         """Add an inline or standalone comment to the line."""
1573         if (
1574             comment.type == STANDALONE_COMMENT
1575             and self.bracket_tracker.any_open_brackets()
1576         ):
1577             comment.prefix = ""
1578             return False
1579
1580         if comment.type != token.COMMENT:
1581             return False
1582
1583         if not self.leaves:
1584             comment.type = STANDALONE_COMMENT
1585             comment.prefix = ""
1586             return False
1587
1588         last_leaf = self.leaves[-1]
1589         if (
1590             last_leaf.type == token.RPAR
1591             and not last_leaf.value
1592             and last_leaf.parent
1593             and len(list(last_leaf.parent.leaves())) <= 3
1594             and not is_type_comment(comment)
1595         ):
1596             # Comments on an optional parens wrapping a single leaf should belong to
1597             # the wrapped node except if it's a type comment. Pinning the comment like
1598             # this avoids unstable formatting caused by comment migration.
1599             if len(self.leaves) < 2:
1600                 comment.type = STANDALONE_COMMENT
1601                 comment.prefix = ""
1602                 return False
1603
1604             last_leaf = self.leaves[-2]
1605         self.comments.setdefault(id(last_leaf), []).append(comment)
1606         return True
1607
1608     def comments_after(self, leaf: Leaf) -> List[Leaf]:
1609         """Generate comments that should appear directly after `leaf`."""
1610         return self.comments.get(id(leaf), [])
1611
1612     def remove_trailing_comma(self) -> None:
1613         """Remove the trailing comma and moves the comments attached to it."""
1614         trailing_comma = self.leaves.pop()
1615         trailing_comma_comments = self.comments.pop(id(trailing_comma), [])
1616         self.comments.setdefault(id(self.leaves[-1]), []).extend(
1617             trailing_comma_comments
1618         )
1619
1620     def is_complex_subscript(self, leaf: Leaf) -> bool:
1621         """Return True iff `leaf` is part of a slice with non-trivial exprs."""
1622         open_lsqb = self.bracket_tracker.get_open_lsqb()
1623         if open_lsqb is None:
1624             return False
1625
1626         subscript_start = open_lsqb.next_sibling
1627
1628         if isinstance(subscript_start, Node):
1629             if subscript_start.type == syms.listmaker:
1630                 return False
1631
1632             if subscript_start.type == syms.subscriptlist:
1633                 subscript_start = child_towards(subscript_start, leaf)
1634         return subscript_start is not None and any(
1635             n.type in TEST_DESCENDANTS for n in subscript_start.pre_order()
1636         )
1637
1638     def clone(self) -> "Line":
1639         return Line(
1640             depth=self.depth,
1641             inside_brackets=self.inside_brackets,
1642             should_explode=self.should_explode,
1643         )
1644
1645     def __str__(self) -> str:
1646         """Render the line."""
1647         if not self:
1648             return "\n"
1649
1650         indent = "    " * self.depth
1651         leaves = iter(self.leaves)
1652         first = next(leaves)
1653         res = f"{first.prefix}{indent}{first.value}"
1654         for leaf in leaves:
1655             res += str(leaf)
1656         for comment in itertools.chain.from_iterable(self.comments.values()):
1657             res += str(comment)
1658
1659         return res + "\n"
1660
1661     def __bool__(self) -> bool:
1662         """Return True if the line has leaves or comments."""
1663         return bool(self.leaves or self.comments)
1664
1665
1666 @dataclass
1667 class EmptyLineTracker:
1668     """Provides a stateful method that returns the number of potential extra
1669     empty lines needed before and after the currently processed line.
1670
1671     Note: this tracker works on lines that haven't been split yet.  It assumes
1672     the prefix of the first leaf consists of optional newlines.  Those newlines
1673     are consumed by `maybe_empty_lines()` and included in the computation.
1674     """
1675
1676     is_pyi: bool = False
1677     previous_line: Optional[Line] = None
1678     previous_after: int = 0
1679     previous_defs: List[int] = field(default_factory=list)
1680
1681     def maybe_empty_lines(self, current_line: Line) -> Tuple[int, int]:
1682         """Return the number of extra empty lines before and after the `current_line`.
1683
1684         This is for separating `def`, `async def` and `class` with extra empty
1685         lines (two on module-level).
1686         """
1687         before, after = self._maybe_empty_lines(current_line)
1688         before = (
1689             # Black should not insert empty lines at the beginning
1690             # of the file
1691             0
1692             if self.previous_line is None
1693             else before - self.previous_after
1694         )
1695         self.previous_after = after
1696         self.previous_line = current_line
1697         return before, after
1698
1699     def _maybe_empty_lines(self, current_line: Line) -> Tuple[int, int]:
1700         max_allowed = 1
1701         if current_line.depth == 0:
1702             max_allowed = 1 if self.is_pyi else 2
1703         if current_line.leaves:
1704             # Consume the first leaf's extra newlines.
1705             first_leaf = current_line.leaves[0]
1706             before = first_leaf.prefix.count("\n")
1707             before = min(before, max_allowed)
1708             first_leaf.prefix = ""
1709         else:
1710             before = 0
1711         depth = current_line.depth
1712         while self.previous_defs and self.previous_defs[-1] >= depth:
1713             self.previous_defs.pop()
1714             if self.is_pyi:
1715                 before = 0 if depth else 1
1716             else:
1717                 before = 1 if depth else 2
1718         if current_line.is_decorator or current_line.is_def or current_line.is_class:
1719             return self._maybe_empty_lines_for_class_or_def(current_line, before)
1720
1721         if (
1722             self.previous_line
1723             and self.previous_line.is_import
1724             and not current_line.is_import
1725             and depth == self.previous_line.depth
1726         ):
1727             return (before or 1), 0
1728
1729         if (
1730             self.previous_line
1731             and self.previous_line.is_class
1732             and current_line.is_triple_quoted_string
1733         ):
1734             return before, 1
1735
1736         return before, 0
1737
1738     def _maybe_empty_lines_for_class_or_def(
1739         self, current_line: Line, before: int
1740     ) -> Tuple[int, int]:
1741         if not current_line.is_decorator:
1742             self.previous_defs.append(current_line.depth)
1743         if self.previous_line is None:
1744             # Don't insert empty lines before the first line in the file.
1745             return 0, 0
1746
1747         if self.previous_line.is_decorator:
1748             return 0, 0
1749
1750         if self.previous_line.depth < current_line.depth and (
1751             self.previous_line.is_class or self.previous_line.is_def
1752         ):
1753             return 0, 0
1754
1755         if (
1756             self.previous_line.is_comment
1757             and self.previous_line.depth == current_line.depth
1758             and before == 0
1759         ):
1760             return 0, 0
1761
1762         if self.is_pyi:
1763             if self.previous_line.depth > current_line.depth:
1764                 newlines = 1
1765             elif current_line.is_class or self.previous_line.is_class:
1766                 if current_line.is_stub_class and self.previous_line.is_stub_class:
1767                     # No blank line between classes with an empty body
1768                     newlines = 0
1769                 else:
1770                     newlines = 1
1771             elif current_line.is_def and not self.previous_line.is_def:
1772                 # Blank line between a block of functions and a block of non-functions
1773                 newlines = 1
1774             else:
1775                 newlines = 0
1776         else:
1777             newlines = 2
1778         if current_line.depth and newlines:
1779             newlines -= 1
1780         return newlines, 0
1781
1782
1783 @dataclass
1784 class LineGenerator(Visitor[Line]):
1785     """Generates reformatted Line objects.  Empty lines are not emitted.
1786
1787     Note: destroys the tree it's visiting by mutating prefixes of its leaves
1788     in ways that will no longer stringify to valid Python code on the tree.
1789     """
1790
1791     is_pyi: bool = False
1792     normalize_strings: bool = True
1793     current_line: Line = field(default_factory=Line)
1794     remove_u_prefix: bool = False
1795
1796     def line(self, indent: int = 0) -> Iterator[Line]:
1797         """Generate a line.
1798
1799         If the line is empty, only emit if it makes sense.
1800         If the line is too long, split it first and then generate.
1801
1802         If any lines were generated, set up a new current_line.
1803         """
1804         if not self.current_line:
1805             self.current_line.depth += indent
1806             return  # Line is empty, don't emit. Creating a new one unnecessary.
1807
1808         complete_line = self.current_line
1809         self.current_line = Line(depth=complete_line.depth + indent)
1810         yield complete_line
1811
1812     def visit_default(self, node: LN) -> Iterator[Line]:
1813         """Default `visit_*()` implementation. Recurses to children of `node`."""
1814         if isinstance(node, Leaf):
1815             any_open_brackets = self.current_line.bracket_tracker.any_open_brackets()
1816             for comment in generate_comments(node):
1817                 if any_open_brackets:
1818                     # any comment within brackets is subject to splitting
1819                     self.current_line.append(comment)
1820                 elif comment.type == token.COMMENT:
1821                     # regular trailing comment
1822                     self.current_line.append(comment)
1823                     yield from self.line()
1824
1825                 else:
1826                     # regular standalone comment
1827                     yield from self.line()
1828
1829                     self.current_line.append(comment)
1830                     yield from self.line()
1831
1832             normalize_prefix(node, inside_brackets=any_open_brackets)
1833             if self.normalize_strings and node.type == token.STRING:
1834                 normalize_string_prefix(node, remove_u_prefix=self.remove_u_prefix)
1835                 normalize_string_quotes(node)
1836             if node.type == token.NUMBER:
1837                 normalize_numeric_literal(node)
1838             if node.type not in WHITESPACE:
1839                 self.current_line.append(node)
1840         yield from super().visit_default(node)
1841
1842     def visit_INDENT(self, node: Leaf) -> Iterator[Line]:
1843         """Increase indentation level, maybe yield a line."""
1844         # In blib2to3 INDENT never holds comments.
1845         yield from self.line(+1)
1846         yield from self.visit_default(node)
1847
1848     def visit_DEDENT(self, node: Leaf) -> Iterator[Line]:
1849         """Decrease indentation level, maybe yield a line."""
1850         # The current line might still wait for trailing comments.  At DEDENT time
1851         # there won't be any (they would be prefixes on the preceding NEWLINE).
1852         # Emit the line then.
1853         yield from self.line()
1854
1855         # While DEDENT has no value, its prefix may contain standalone comments
1856         # that belong to the current indentation level.  Get 'em.
1857         yield from self.visit_default(node)
1858
1859         # Finally, emit the dedent.
1860         yield from self.line(-1)
1861
1862     def visit_stmt(
1863         self, node: Node, keywords: Set[str], parens: Set[str]
1864     ) -> Iterator[Line]:
1865         """Visit a statement.
1866
1867         This implementation is shared for `if`, `while`, `for`, `try`, `except`,
1868         `def`, `with`, `class`, `assert` and assignments.
1869
1870         The relevant Python language `keywords` for a given statement will be
1871         NAME leaves within it. This methods puts those on a separate line.
1872
1873         `parens` holds a set of string leaf values immediately after which
1874         invisible parens should be put.
1875         """
1876         normalize_invisible_parens(node, parens_after=parens)
1877         for child in node.children:
1878             if child.type == token.NAME and child.value in keywords:  # type: ignore
1879                 yield from self.line()
1880
1881             yield from self.visit(child)
1882
1883     def visit_suite(self, node: Node) -> Iterator[Line]:
1884         """Visit a suite."""
1885         if self.is_pyi and is_stub_suite(node):
1886             yield from self.visit(node.children[2])
1887         else:
1888             yield from self.visit_default(node)
1889
1890     def visit_simple_stmt(self, node: Node) -> Iterator[Line]:
1891         """Visit a statement without nested statements."""
1892         is_suite_like = node.parent and node.parent.type in STATEMENT
1893         if is_suite_like:
1894             if self.is_pyi and is_stub_body(node):
1895                 yield from self.visit_default(node)
1896             else:
1897                 yield from self.line(+1)
1898                 yield from self.visit_default(node)
1899                 yield from self.line(-1)
1900
1901         else:
1902             if not self.is_pyi or not node.parent or not is_stub_suite(node.parent):
1903                 yield from self.line()
1904             yield from self.visit_default(node)
1905
1906     def visit_async_stmt(self, node: Node) -> Iterator[Line]:
1907         """Visit `async def`, `async for`, `async with`."""
1908         yield from self.line()
1909
1910         children = iter(node.children)
1911         for child in children:
1912             yield from self.visit(child)
1913
1914             if child.type == token.ASYNC:
1915                 break
1916
1917         internal_stmt = next(children)
1918         for child in internal_stmt.children:
1919             yield from self.visit(child)
1920
1921     def visit_decorators(self, node: Node) -> Iterator[Line]:
1922         """Visit decorators."""
1923         for child in node.children:
1924             yield from self.line()
1925             yield from self.visit(child)
1926
1927     def visit_SEMI(self, leaf: Leaf) -> Iterator[Line]:
1928         """Remove a semicolon and put the other statement on a separate line."""
1929         yield from self.line()
1930
1931     def visit_ENDMARKER(self, leaf: Leaf) -> Iterator[Line]:
1932         """End of file. Process outstanding comments and end with a newline."""
1933         yield from self.visit_default(leaf)
1934         yield from self.line()
1935
1936     def visit_STANDALONE_COMMENT(self, leaf: Leaf) -> Iterator[Line]:
1937         if not self.current_line.bracket_tracker.any_open_brackets():
1938             yield from self.line()
1939         yield from self.visit_default(leaf)
1940
1941     def visit_factor(self, node: Node) -> Iterator[Line]:
1942         """Force parentheses between a unary op and a binary power:
1943
1944         -2 ** 8 -> -(2 ** 8)
1945         """
1946         _operator, operand = node.children
1947         if (
1948             operand.type == syms.power
1949             and len(operand.children) == 3
1950             and operand.children[1].type == token.DOUBLESTAR
1951         ):
1952             lpar = Leaf(token.LPAR, "(")
1953             rpar = Leaf(token.RPAR, ")")
1954             index = operand.remove() or 0
1955             node.insert_child(index, Node(syms.atom, [lpar, operand, rpar]))
1956         yield from self.visit_default(node)
1957
1958     def __post_init__(self) -> None:
1959         """You are in a twisty little maze of passages."""
1960         v = self.visit_stmt
1961         Ø: Set[str] = set()
1962         self.visit_assert_stmt = partial(v, keywords={"assert"}, parens={"assert", ","})
1963         self.visit_if_stmt = partial(
1964             v, keywords={"if", "else", "elif"}, parens={"if", "elif"}
1965         )
1966         self.visit_while_stmt = partial(v, keywords={"while", "else"}, parens={"while"})
1967         self.visit_for_stmt = partial(v, keywords={"for", "else"}, parens={"for", "in"})
1968         self.visit_try_stmt = partial(
1969             v, keywords={"try", "except", "else", "finally"}, parens=Ø
1970         )
1971         self.visit_except_clause = partial(v, keywords={"except"}, parens=Ø)
1972         self.visit_with_stmt = partial(v, keywords={"with"}, parens=Ø)
1973         self.visit_funcdef = partial(v, keywords={"def"}, parens=Ø)
1974         self.visit_classdef = partial(v, keywords={"class"}, parens=Ø)
1975         self.visit_expr_stmt = partial(v, keywords=Ø, parens=ASSIGNMENTS)
1976         self.visit_return_stmt = partial(v, keywords={"return"}, parens={"return"})
1977         self.visit_import_from = partial(v, keywords=Ø, parens={"import"})
1978         self.visit_del_stmt = partial(v, keywords=Ø, parens={"del"})
1979         self.visit_async_funcdef = self.visit_async_stmt
1980         self.visit_decorated = self.visit_decorators
1981
1982
1983 IMPLICIT_TUPLE = {syms.testlist, syms.testlist_star_expr, syms.exprlist}
1984 BRACKET = {token.LPAR: token.RPAR, token.LSQB: token.RSQB, token.LBRACE: token.RBRACE}
1985 OPENING_BRACKETS = set(BRACKET.keys())
1986 CLOSING_BRACKETS = set(BRACKET.values())
1987 BRACKETS = OPENING_BRACKETS | CLOSING_BRACKETS
1988 ALWAYS_NO_SPACE = CLOSING_BRACKETS | {token.COMMA, STANDALONE_COMMENT}
1989
1990
1991 def whitespace(leaf: Leaf, *, complex_subscript: bool) -> str:  # noqa: C901
1992     """Return whitespace prefix if needed for the given `leaf`.
1993
1994     `complex_subscript` signals whether the given leaf is part of a subscription
1995     which has non-trivial arguments, like arithmetic expressions or function calls.
1996     """
1997     NO = ""
1998     SPACE = " "
1999     DOUBLESPACE = "  "
2000     t = leaf.type
2001     p = leaf.parent
2002     v = leaf.value
2003     if t in ALWAYS_NO_SPACE:
2004         return NO
2005
2006     if t == token.COMMENT:
2007         return DOUBLESPACE
2008
2009     assert p is not None, f"INTERNAL ERROR: hand-made leaf without parent: {leaf!r}"
2010     if t == token.COLON and p.type not in {
2011         syms.subscript,
2012         syms.subscriptlist,
2013         syms.sliceop,
2014     }:
2015         return NO
2016
2017     prev = leaf.prev_sibling
2018     if not prev:
2019         prevp = preceding_leaf(p)
2020         if not prevp or prevp.type in OPENING_BRACKETS:
2021             return NO
2022
2023         if t == token.COLON:
2024             if prevp.type == token.COLON:
2025                 return NO
2026
2027             elif prevp.type != token.COMMA and not complex_subscript:
2028                 return NO
2029
2030             return SPACE
2031
2032         if prevp.type == token.EQUAL:
2033             if prevp.parent:
2034                 if prevp.parent.type in {
2035                     syms.arglist,
2036                     syms.argument,
2037                     syms.parameters,
2038                     syms.varargslist,
2039                 }:
2040                     return NO
2041
2042                 elif prevp.parent.type == syms.typedargslist:
2043                     # A bit hacky: if the equal sign has whitespace, it means we
2044                     # previously found it's a typed argument.  So, we're using
2045                     # that, too.
2046                     return prevp.prefix
2047
2048         elif prevp.type in VARARGS_SPECIALS:
2049             if is_vararg(prevp, within=VARARGS_PARENTS | UNPACKING_PARENTS):
2050                 return NO
2051
2052         elif prevp.type == token.COLON:
2053             if prevp.parent and prevp.parent.type in {syms.subscript, syms.sliceop}:
2054                 return SPACE if complex_subscript else NO
2055
2056         elif (
2057             prevp.parent
2058             and prevp.parent.type == syms.factor
2059             and prevp.type in MATH_OPERATORS
2060         ):
2061             return NO
2062
2063         elif (
2064             prevp.type == token.RIGHTSHIFT
2065             and prevp.parent
2066             and prevp.parent.type == syms.shift_expr
2067             and prevp.prev_sibling
2068             and prevp.prev_sibling.type == token.NAME
2069             and prevp.prev_sibling.value == "print"  # type: ignore
2070         ):
2071             # Python 2 print chevron
2072             return NO
2073
2074     elif prev.type in OPENING_BRACKETS:
2075         return NO
2076
2077     if p.type in {syms.parameters, syms.arglist}:
2078         # untyped function signatures or calls
2079         if not prev or prev.type != token.COMMA:
2080             return NO
2081
2082     elif p.type == syms.varargslist:
2083         # lambdas
2084         if prev and prev.type != token.COMMA:
2085             return NO
2086
2087     elif p.type == syms.typedargslist:
2088         # typed function signatures
2089         if not prev:
2090             return NO
2091
2092         if t == token.EQUAL:
2093             if prev.type != syms.tname:
2094                 return NO
2095
2096         elif prev.type == token.EQUAL:
2097             # A bit hacky: if the equal sign has whitespace, it means we
2098             # previously found it's a typed argument.  So, we're using that, too.
2099             return prev.prefix
2100
2101         elif prev.type != token.COMMA:
2102             return NO
2103
2104     elif p.type == syms.tname:
2105         # type names
2106         if not prev:
2107             prevp = preceding_leaf(p)
2108             if not prevp or prevp.type != token.COMMA:
2109                 return NO
2110
2111     elif p.type == syms.trailer:
2112         # attributes and calls
2113         if t == token.LPAR or t == token.RPAR:
2114             return NO
2115
2116         if not prev:
2117             if t == token.DOT:
2118                 prevp = preceding_leaf(p)
2119                 if not prevp or prevp.type != token.NUMBER:
2120                     return NO
2121
2122             elif t == token.LSQB:
2123                 return NO
2124
2125         elif prev.type != token.COMMA:
2126             return NO
2127
2128     elif p.type == syms.argument:
2129         # single argument
2130         if t == token.EQUAL:
2131             return NO
2132
2133         if not prev:
2134             prevp = preceding_leaf(p)
2135             if not prevp or prevp.type == token.LPAR:
2136                 return NO
2137
2138         elif prev.type in {token.EQUAL} | VARARGS_SPECIALS:
2139             return NO
2140
2141     elif p.type == syms.decorator:
2142         # decorators
2143         return NO
2144
2145     elif p.type == syms.dotted_name:
2146         if prev:
2147             return NO
2148
2149         prevp = preceding_leaf(p)
2150         if not prevp or prevp.type == token.AT or prevp.type == token.DOT:
2151             return NO
2152
2153     elif p.type == syms.classdef:
2154         if t == token.LPAR:
2155             return NO
2156
2157         if prev and prev.type == token.LPAR:
2158             return NO
2159
2160     elif p.type in {syms.subscript, syms.sliceop}:
2161         # indexing
2162         if not prev:
2163             assert p.parent is not None, "subscripts are always parented"
2164             if p.parent.type == syms.subscriptlist:
2165                 return SPACE
2166
2167             return NO
2168
2169         elif not complex_subscript:
2170             return NO
2171
2172     elif p.type == syms.atom:
2173         if prev and t == token.DOT:
2174             # dots, but not the first one.
2175             return NO
2176
2177     elif p.type == syms.dictsetmaker:
2178         # dict unpacking
2179         if prev and prev.type == token.DOUBLESTAR:
2180             return NO
2181
2182     elif p.type in {syms.factor, syms.star_expr}:
2183         # unary ops
2184         if not prev:
2185             prevp = preceding_leaf(p)
2186             if not prevp or prevp.type in OPENING_BRACKETS:
2187                 return NO
2188
2189             prevp_parent = prevp.parent
2190             assert prevp_parent is not None
2191             if prevp.type == token.COLON and prevp_parent.type in {
2192                 syms.subscript,
2193                 syms.sliceop,
2194             }:
2195                 return NO
2196
2197             elif prevp.type == token.EQUAL and prevp_parent.type == syms.argument:
2198                 return NO
2199
2200         elif t in {token.NAME, token.NUMBER, token.STRING}:
2201             return NO
2202
2203     elif p.type == syms.import_from:
2204         if t == token.DOT:
2205             if prev and prev.type == token.DOT:
2206                 return NO
2207
2208         elif t == token.NAME:
2209             if v == "import":
2210                 return SPACE
2211
2212             if prev and prev.type == token.DOT:
2213                 return NO
2214
2215     elif p.type == syms.sliceop:
2216         return NO
2217
2218     return SPACE
2219
2220
2221 def preceding_leaf(node: Optional[LN]) -> Optional[Leaf]:
2222     """Return the first leaf that precedes `node`, if any."""
2223     while node:
2224         res = node.prev_sibling
2225         if res:
2226             if isinstance(res, Leaf):
2227                 return res
2228
2229             try:
2230                 return list(res.leaves())[-1]
2231
2232             except IndexError:
2233                 return None
2234
2235         node = node.parent
2236     return None
2237
2238
2239 def child_towards(ancestor: Node, descendant: LN) -> Optional[LN]:
2240     """Return the child of `ancestor` that contains `descendant`."""
2241     node: Optional[LN] = descendant
2242     while node and node.parent != ancestor:
2243         node = node.parent
2244     return node
2245
2246
2247 def container_of(leaf: Leaf) -> LN:
2248     """Return `leaf` or one of its ancestors that is the topmost container of it.
2249
2250     By "container" we mean a node where `leaf` is the very first child.
2251     """
2252     same_prefix = leaf.prefix
2253     container: LN = leaf
2254     while container:
2255         parent = container.parent
2256         if parent is None:
2257             break
2258
2259         if parent.children[0].prefix != same_prefix:
2260             break
2261
2262         if parent.type == syms.file_input:
2263             break
2264
2265         if parent.prev_sibling is not None and parent.prev_sibling.type in BRACKETS:
2266             break
2267
2268         container = parent
2269     return container
2270
2271
2272 def is_split_after_delimiter(leaf: Leaf, previous: Optional[Leaf] = None) -> Priority:
2273     """Return the priority of the `leaf` delimiter, given a line break after it.
2274
2275     The delimiter priorities returned here are from those delimiters that would
2276     cause a line break after themselves.
2277
2278     Higher numbers are higher priority.
2279     """
2280     if leaf.type == token.COMMA:
2281         return COMMA_PRIORITY
2282
2283     return 0
2284
2285
2286 def is_split_before_delimiter(leaf: Leaf, previous: Optional[Leaf] = None) -> Priority:
2287     """Return the priority of the `leaf` delimiter, given a line break before it.
2288
2289     The delimiter priorities returned here are from those delimiters that would
2290     cause a line break before themselves.
2291
2292     Higher numbers are higher priority.
2293     """
2294     if is_vararg(leaf, within=VARARGS_PARENTS | UNPACKING_PARENTS):
2295         # * and ** might also be MATH_OPERATORS but in this case they are not.
2296         # Don't treat them as a delimiter.
2297         return 0
2298
2299     if (
2300         leaf.type == token.DOT
2301         and leaf.parent
2302         and leaf.parent.type not in {syms.import_from, syms.dotted_name}
2303         and (previous is None or previous.type in CLOSING_BRACKETS)
2304     ):
2305         return DOT_PRIORITY
2306
2307     if (
2308         leaf.type in MATH_OPERATORS
2309         and leaf.parent
2310         and leaf.parent.type not in {syms.factor, syms.star_expr}
2311     ):
2312         return MATH_PRIORITIES[leaf.type]
2313
2314     if leaf.type in COMPARATORS:
2315         return COMPARATOR_PRIORITY
2316
2317     if (
2318         leaf.type == token.STRING
2319         and previous is not None
2320         and previous.type == token.STRING
2321     ):
2322         return STRING_PRIORITY
2323
2324     if leaf.type not in {token.NAME, token.ASYNC}:
2325         return 0
2326
2327     if (
2328         leaf.value == "for"
2329         and leaf.parent
2330         and leaf.parent.type in {syms.comp_for, syms.old_comp_for}
2331         or leaf.type == token.ASYNC
2332     ):
2333         if (
2334             not isinstance(leaf.prev_sibling, Leaf)
2335             or leaf.prev_sibling.value != "async"
2336         ):
2337             return COMPREHENSION_PRIORITY
2338
2339     if (
2340         leaf.value == "if"
2341         and leaf.parent
2342         and leaf.parent.type in {syms.comp_if, syms.old_comp_if}
2343     ):
2344         return COMPREHENSION_PRIORITY
2345
2346     if leaf.value in {"if", "else"} and leaf.parent and leaf.parent.type == syms.test:
2347         return TERNARY_PRIORITY
2348
2349     if leaf.value == "is":
2350         return COMPARATOR_PRIORITY
2351
2352     if (
2353         leaf.value == "in"
2354         and leaf.parent
2355         and leaf.parent.type in {syms.comp_op, syms.comparison}
2356         and not (
2357             previous is not None
2358             and previous.type == token.NAME
2359             and previous.value == "not"
2360         )
2361     ):
2362         return COMPARATOR_PRIORITY
2363
2364     if (
2365         leaf.value == "not"
2366         and leaf.parent
2367         and leaf.parent.type == syms.comp_op
2368         and not (
2369             previous is not None
2370             and previous.type == token.NAME
2371             and previous.value == "is"
2372         )
2373     ):
2374         return COMPARATOR_PRIORITY
2375
2376     if leaf.value in LOGIC_OPERATORS and leaf.parent:
2377         return LOGIC_PRIORITY
2378
2379     return 0
2380
2381
2382 FMT_OFF = {"# fmt: off", "# fmt:off", "# yapf: disable"}
2383 FMT_ON = {"# fmt: on", "# fmt:on", "# yapf: enable"}
2384
2385
2386 def generate_comments(leaf: LN) -> Iterator[Leaf]:
2387     """Clean the prefix of the `leaf` and generate comments from it, if any.
2388
2389     Comments in lib2to3 are shoved into the whitespace prefix.  This happens
2390     in `pgen2/driver.py:Driver.parse_tokens()`.  This was a brilliant implementation
2391     move because it does away with modifying the grammar to include all the
2392     possible places in which comments can be placed.
2393
2394     The sad consequence for us though is that comments don't "belong" anywhere.
2395     This is why this function generates simple parentless Leaf objects for
2396     comments.  We simply don't know what the correct parent should be.
2397
2398     No matter though, we can live without this.  We really only need to
2399     differentiate between inline and standalone comments.  The latter don't
2400     share the line with any code.
2401
2402     Inline comments are emitted as regular token.COMMENT leaves.  Standalone
2403     are emitted with a fake STANDALONE_COMMENT token identifier.
2404     """
2405     for pc in list_comments(leaf.prefix, is_endmarker=leaf.type == token.ENDMARKER):
2406         yield Leaf(pc.type, pc.value, prefix="\n" * pc.newlines)
2407
2408
2409 @dataclass
2410 class ProtoComment:
2411     """Describes a piece of syntax that is a comment.
2412
2413     It's not a :class:`blib2to3.pytree.Leaf` so that:
2414
2415     * it can be cached (`Leaf` objects should not be reused more than once as
2416       they store their lineno, column, prefix, and parent information);
2417     * `newlines` and `consumed` fields are kept separate from the `value`. This
2418       simplifies handling of special marker comments like ``# fmt: off/on``.
2419     """
2420
2421     type: int  # token.COMMENT or STANDALONE_COMMENT
2422     value: str  # content of the comment
2423     newlines: int  # how many newlines before the comment
2424     consumed: int  # how many characters of the original leaf's prefix did we consume
2425
2426
2427 @lru_cache(maxsize=4096)
2428 def list_comments(prefix: str, *, is_endmarker: bool) -> List[ProtoComment]:
2429     """Return a list of :class:`ProtoComment` objects parsed from the given `prefix`."""
2430     result: List[ProtoComment] = []
2431     if not prefix or "#" not in prefix:
2432         return result
2433
2434     consumed = 0
2435     nlines = 0
2436     ignored_lines = 0
2437     for index, line in enumerate(prefix.split("\n")):
2438         consumed += len(line) + 1  # adding the length of the split '\n'
2439         line = line.lstrip()
2440         if not line:
2441             nlines += 1
2442         if not line.startswith("#"):
2443             # Escaped newlines outside of a comment are not really newlines at
2444             # all. We treat a single-line comment following an escaped newline
2445             # as a simple trailing comment.
2446             if line.endswith("\\"):
2447                 ignored_lines += 1
2448             continue
2449
2450         if index == ignored_lines and not is_endmarker:
2451             comment_type = token.COMMENT  # simple trailing comment
2452         else:
2453             comment_type = STANDALONE_COMMENT
2454         comment = make_comment(line)
2455         result.append(
2456             ProtoComment(
2457                 type=comment_type, value=comment, newlines=nlines, consumed=consumed
2458             )
2459         )
2460         nlines = 0
2461     return result
2462
2463
2464 def make_comment(content: str) -> str:
2465     """Return a consistently formatted comment from the given `content` string.
2466
2467     All comments (except for "##", "#!", "#:", '#'", "#%%") should have a single
2468     space between the hash sign and the content.
2469
2470     If `content` didn't start with a hash sign, one is provided.
2471     """
2472     content = content.rstrip()
2473     if not content:
2474         return "#"
2475
2476     if content[0] == "#":
2477         content = content[1:]
2478     if content and content[0] not in " !:#'%":
2479         content = " " + content
2480     return "#" + content
2481
2482
2483 def transform_line(
2484     line: Line,
2485     line_length: int,
2486     normalize_strings: bool,
2487     features: Collection[Feature] = (),
2488 ) -> Iterator[Line]:
2489     """Transform a `line`, potentially splitting it into many lines.
2490
2491     They should fit in the allotted `line_length` but might not be able to.
2492
2493     `features` are syntactical features that may be used in the output.
2494     """
2495     if line.is_comment:
2496         yield line
2497         return
2498
2499     line_str = line_to_string(line)
2500
2501     def init_st(ST: Type[StringTransformer]) -> StringTransformer:
2502         """Initialize StringTransformer"""
2503         return ST(line_length, normalize_strings)
2504
2505     string_merge = init_st(StringMerger)
2506     string_paren_strip = init_st(StringParenStripper)
2507     string_split = init_st(StringSplitter)
2508     string_paren_wrap = init_st(StringParenWrapper)
2509
2510     transformers: List[Transformer]
2511     if (
2512         not line.contains_uncollapsable_type_comments()
2513         and not line.should_explode
2514         and not line.is_collection_with_optional_trailing_comma
2515         and (
2516             is_line_short_enough(line, line_length=line_length, line_str=line_str)
2517             or line.contains_unsplittable_type_ignore()
2518         )
2519     ):
2520         # Only apply basic string preprocessing, since lines shouldn't be split here.
2521         transformers = [string_merge, string_paren_strip]
2522     elif line.is_def:
2523         transformers = [left_hand_split]
2524     else:
2525
2526         def rhs(line: Line, features: Collection[Feature]) -> Iterator[Line]:
2527             for omit in generate_trailers_to_omit(line, line_length):
2528                 lines = list(right_hand_split(line, line_length, features, omit=omit))
2529                 if is_line_short_enough(lines[0], line_length=line_length):
2530                     yield from lines
2531                     return
2532
2533             # All splits failed, best effort split with no omits.
2534             # This mostly happens to multiline strings that are by definition
2535             # reported as not fitting a single line.
2536             # line_length=1 here was historically a bug that somehow became a feature.
2537             # See #762 and #781 for the full story.
2538             yield from right_hand_split(line, line_length=1, features=features)
2539
2540         if line.inside_brackets:
2541             transformers = [
2542                 string_merge,
2543                 string_paren_strip,
2544                 delimiter_split,
2545                 standalone_comment_split,
2546                 string_split,
2547                 string_paren_wrap,
2548                 rhs,
2549             ]
2550         else:
2551             transformers = [
2552                 string_merge,
2553                 string_paren_strip,
2554                 string_split,
2555                 string_paren_wrap,
2556                 rhs,
2557             ]
2558
2559     for transform in transformers:
2560         # We are accumulating lines in `result` because we might want to abort
2561         # mission and return the original line in the end, or attempt a different
2562         # split altogether.
2563         result: List[Line] = []
2564         try:
2565             for l in transform(line, features):
2566                 if str(l).strip("\n") == line_str:
2567                     raise CannotTransform(
2568                         "Line transformer returned an unchanged result"
2569                     )
2570
2571                 result.extend(
2572                     transform_line(
2573                         l,
2574                         line_length=line_length,
2575                         normalize_strings=normalize_strings,
2576                         features=features,
2577                     )
2578                 )
2579         except CannotTransform:
2580             continue
2581         else:
2582             yield from result
2583             break
2584
2585     else:
2586         yield line
2587
2588
2589 @dataclass  # type: ignore
2590 class StringTransformer(ABC):
2591     """
2592     An implementation of the Transformer protocol that relies on its
2593     subclasses overriding the template methods `do_match(...)` and
2594     `do_transform(...)`.
2595
2596     This Transformer works exclusively on strings (for example, by merging
2597     or splitting them).
2598
2599     The following sections can be found among the docstrings of each concrete
2600     StringTransformer subclass.
2601
2602     Requirements:
2603         Which requirements must be met of the given Line for this
2604         StringTransformer to be applied?
2605
2606     Transformations:
2607         If the given Line meets all of the above requirments, which string
2608         transformations can you expect to be applied to it by this
2609         StringTransformer?
2610
2611     Collaborations:
2612         What contractual agreements does this StringTransformer have with other
2613         StringTransfomers? Such collaborations should be eliminated/minimized
2614         as much as possible.
2615     """
2616
2617     line_length: int
2618     normalize_strings: bool
2619
2620     @abstractmethod
2621     def do_match(self, line: Line) -> TMatchResult:
2622         """
2623         Returns:
2624             * Ok(string_idx) such that `line.leaves[string_idx]` is our target
2625             string, if a match was able to be made.
2626                 OR
2627             * Err(CannotTransform), if a match was not able to be made.
2628         """
2629
2630     @abstractmethod
2631     def do_transform(self, line: Line, string_idx: int) -> Iterator[TResult[Line]]:
2632         """
2633         Yields:
2634             * Ok(new_line) where new_line is the new transformed line.
2635                 OR
2636             * Err(CannotTransform) if the transformation failed for some reason. The
2637             `do_match(...)` template method should usually be used to reject
2638             the form of the given Line, but in some cases it is difficult to
2639             know whether or not a Line meets the StringTransformer's
2640             requirements until the transformation is already midway.
2641
2642         Side Effects:
2643             This method should NOT mutate @line directly, but it MAY mutate the
2644             Line's underlying Node structure. (WARNING: If the underlying Node
2645             structure IS altered, then this method should NOT be allowed to
2646             yield an CannotTransform after that point.)
2647         """
2648
2649     def __call__(self, line: Line, _features: Collection[Feature]) -> Iterator[Line]:
2650         """
2651         StringTransformer instances have a call signature that mirrors that of
2652         the Transformer type.
2653
2654         Raises:
2655             CannotTransform(...) if the concrete StringTransformer class is unable
2656             to transform @line.
2657         """
2658         # Optimization to avoid calling `self.do_match(...)` when the line does
2659         # not contain any string.
2660         if not any(leaf.type == token.STRING for leaf in line.leaves):
2661             raise CannotTransform("There are no strings in this line.")
2662
2663         match_result = self.do_match(line)
2664
2665         if isinstance(match_result, Err):
2666             cant_transform = match_result.err()
2667             raise CannotTransform(
2668                 f"The string transformer {self.__class__.__name__} does not recognize"
2669                 " this line as one that it can transform."
2670             ) from cant_transform
2671
2672         string_idx = match_result.ok()
2673
2674         for line_result in self.do_transform(line, string_idx):
2675             if isinstance(line_result, Err):
2676                 cant_transform = line_result.err()
2677                 raise CannotTransform(
2678                     "StringTransformer failed while attempting to transform string."
2679                 ) from cant_transform
2680             line = line_result.ok()
2681             yield line
2682
2683
2684 @dataclass
2685 class CustomSplit:
2686     """A custom (i.e. manual) string split.
2687
2688     A single CustomSplit instance represents a single substring.
2689
2690     Examples:
2691         Consider the following string:
2692         ```
2693         "Hi there friend."
2694         " This is a custom"
2695         f" string {split}."
2696         ```
2697
2698         This string will correspond to the following three CustomSplit instances:
2699         ```
2700         CustomSplit(False, 16)
2701         CustomSplit(False, 17)
2702         CustomSplit(True, 16)
2703         ```
2704     """
2705
2706     has_prefix: bool
2707     break_idx: int
2708
2709
2710 class CustomSplitMapMixin:
2711     """
2712     This mixin class is used to map merged strings to a sequence of
2713     CustomSplits, which will then be used to re-split the strings iff none of
2714     the resultant substrings go over the configured max line length.
2715     """
2716
2717     _Key = Tuple[StringID, str]
2718     _CUSTOM_SPLIT_MAP: Dict[_Key, Tuple[CustomSplit, ...]] = defaultdict(tuple)
2719
2720     @staticmethod
2721     def _get_key(string: str) -> "CustomSplitMapMixin._Key":
2722         """
2723         Returns:
2724             A unique identifier that is used internally to map @string to a
2725             group of custom splits.
2726         """
2727         return (id(string), string)
2728
2729     def add_custom_splits(
2730         self, string: str, custom_splits: Iterable[CustomSplit]
2731     ) -> None:
2732         """Custom Split Map Setter Method
2733
2734         Side Effects:
2735             Adds a mapping from @string to the custom splits @custom_splits.
2736         """
2737         key = self._get_key(string)
2738         self._CUSTOM_SPLIT_MAP[key] = tuple(custom_splits)
2739
2740     def pop_custom_splits(self, string: str) -> List[CustomSplit]:
2741         """Custom Split Map Getter Method
2742
2743         Returns:
2744             * A list of the custom splits that are mapped to @string, if any
2745             exist.
2746                 OR
2747             * [], otherwise.
2748
2749         Side Effects:
2750             Deletes the mapping between @string and its associated custom
2751             splits (which are returned to the caller).
2752         """
2753         key = self._get_key(string)
2754
2755         custom_splits = self._CUSTOM_SPLIT_MAP[key]
2756         del self._CUSTOM_SPLIT_MAP[key]
2757
2758         return list(custom_splits)
2759
2760     def has_custom_splits(self, string: str) -> bool:
2761         """
2762         Returns:
2763             True iff @string is associated with a set of custom splits.
2764         """
2765         key = self._get_key(string)
2766         return key in self._CUSTOM_SPLIT_MAP
2767
2768
2769 class StringMerger(CustomSplitMapMixin, StringTransformer):
2770     """StringTransformer that merges strings together.
2771
2772     Requirements:
2773         (A) The line contains adjacent strings such that at most one substring
2774         has inline comments AND none of those inline comments are pragmas AND
2775         the set of all substring prefixes is either of length 1 or equal to
2776         {"", "f"} AND none of the substrings are raw strings (i.e. are prefixed
2777         with 'r').
2778             OR
2779         (B) The line contains a string which uses line continuation backslashes.
2780
2781     Transformations:
2782         Depending on which of the two requirements above where met, either:
2783
2784         (A) The string group associated with the target string is merged.
2785             OR
2786         (B) All line-continuation backslashes are removed from the target string.
2787
2788     Collaborations:
2789         StringMerger provides custom split information to StringSplitter.
2790     """
2791
2792     def do_match(self, line: Line) -> TMatchResult:
2793         LL = line.leaves
2794
2795         is_valid_index = is_valid_index_factory(LL)
2796
2797         for (i, leaf) in enumerate(LL):
2798             if (
2799                 leaf.type == token.STRING
2800                 and is_valid_index(i + 1)
2801                 and LL[i + 1].type == token.STRING
2802             ):
2803                 return Ok(i)
2804
2805             if leaf.type == token.STRING and "\\\n" in leaf.value:
2806                 return Ok(i)
2807
2808         return TErr("This line has no strings that need merging.")
2809
2810     def do_transform(self, line: Line, string_idx: int) -> Iterator[TResult[Line]]:
2811         new_line = line
2812         rblc_result = self.__remove_backslash_line_continuation_chars(
2813             new_line, string_idx
2814         )
2815         if isinstance(rblc_result, Ok):
2816             new_line = rblc_result.ok()
2817
2818         msg_result = self.__merge_string_group(new_line, string_idx)
2819         if isinstance(msg_result, Ok):
2820             new_line = msg_result.ok()
2821
2822         if isinstance(rblc_result, Err) and isinstance(msg_result, Err):
2823             msg_cant_transform = msg_result.err()
2824             rblc_cant_transform = rblc_result.err()
2825             cant_transform = CannotTransform(
2826                 "StringMerger failed to merge any strings in this line."
2827             )
2828
2829             # Chain the errors together using `__cause__`.
2830             msg_cant_transform.__cause__ = rblc_cant_transform
2831             cant_transform.__cause__ = msg_cant_transform
2832
2833             yield Err(cant_transform)
2834         else:
2835             yield Ok(new_line)
2836
2837     @staticmethod
2838     def __remove_backslash_line_continuation_chars(
2839         line: Line, string_idx: int
2840     ) -> TResult[Line]:
2841         """
2842         Merge strings that were split across multiple lines using
2843         line-continuation backslashes.
2844
2845         Returns:
2846             Ok(new_line), if @line contains backslash line-continuation
2847             characters.
2848                 OR
2849             Err(CannotTransform), otherwise.
2850         """
2851         LL = line.leaves
2852
2853         string_leaf = LL[string_idx]
2854         if not (
2855             string_leaf.type == token.STRING
2856             and "\\\n" in string_leaf.value
2857             and not has_triple_quotes(string_leaf.value)
2858         ):
2859             return TErr(
2860                 f"String leaf {string_leaf} does not contain any backslash line"
2861                 " continuation characters."
2862             )
2863
2864         new_line = line.clone()
2865         new_line.comments = line.comments
2866         append_leaves(new_line, line, LL)
2867
2868         new_string_leaf = new_line.leaves[string_idx]
2869         new_string_leaf.value = new_string_leaf.value.replace("\\\n", "")
2870
2871         return Ok(new_line)
2872
2873     def __merge_string_group(self, line: Line, string_idx: int) -> TResult[Line]:
2874         """
2875         Merges string group (i.e. set of adjacent strings) where the first
2876         string in the group is `line.leaves[string_idx]`.
2877
2878         Returns:
2879             Ok(new_line), if ALL of the validation checks found in
2880             __validate_msg(...) pass.
2881                 OR
2882             Err(CannotTransform), otherwise.
2883         """
2884         LL = line.leaves
2885
2886         is_valid_index = is_valid_index_factory(LL)
2887
2888         vresult = self.__validate_msg(line, string_idx)
2889         if isinstance(vresult, Err):
2890             return vresult
2891
2892         # If the string group is wrapped inside an Atom node, we must make sure
2893         # to later replace that Atom with our new (merged) string leaf.
2894         atom_node = LL[string_idx].parent
2895
2896         # We will place BREAK_MARK in between every two substrings that we
2897         # merge. We will then later go through our final result and use the
2898         # various instances of BREAK_MARK we find to add the right values to
2899         # the custom split map.
2900         BREAK_MARK = "@@@@@ BLACK BREAKPOINT MARKER @@@@@"
2901
2902         QUOTE = LL[string_idx].value[-1]
2903
2904         def make_naked(string: str, string_prefix: str) -> str:
2905             """Strip @string (i.e. make it a "naked" string)
2906
2907             Pre-conditions:
2908                 * assert_is_leaf_string(@string)
2909
2910             Returns:
2911                 A string that is identical to @string except that
2912                 @string_prefix has been stripped, the surrounding QUOTE
2913                 characters have been removed, and any remaining QUOTE
2914                 characters have been escaped.
2915             """
2916             assert_is_leaf_string(string)
2917
2918             RE_EVEN_BACKSLASHES = r"(?:(?<!\\)(?:\\\\)*)"
2919             naked_string = string[len(string_prefix) + 1 : -1]
2920             naked_string = re.sub(
2921                 "(" + RE_EVEN_BACKSLASHES + ")" + QUOTE, r"\1\\" + QUOTE, naked_string
2922             )
2923             return naked_string
2924
2925         # Holds the CustomSplit objects that will later be added to the custom
2926         # split map.
2927         custom_splits = []
2928
2929         # Temporary storage for the 'has_prefix' part of the CustomSplit objects.
2930         prefix_tracker = []
2931
2932         # Sets the 'prefix' variable. This is the prefix that the final merged
2933         # string will have.
2934         next_str_idx = string_idx
2935         prefix = ""
2936         while (
2937             not prefix
2938             and is_valid_index(next_str_idx)
2939             and LL[next_str_idx].type == token.STRING
2940         ):
2941             prefix = get_string_prefix(LL[next_str_idx].value)
2942             next_str_idx += 1
2943
2944         # The next loop merges the string group. The final string will be
2945         # contained in 'S'.
2946         #
2947         # The following convenience variables are used:
2948         #
2949         #   S: string
2950         #   NS: naked string
2951         #   SS: next string
2952         #   NSS: naked next string
2953         S = ""
2954         NS = ""
2955         num_of_strings = 0
2956         next_str_idx = string_idx
2957         while is_valid_index(next_str_idx) and LL[next_str_idx].type == token.STRING:
2958             num_of_strings += 1
2959
2960             SS = LL[next_str_idx].value
2961             next_prefix = get_string_prefix(SS)
2962
2963             # If this is an f-string group but this substring is not prefixed
2964             # with 'f'...
2965             if "f" in prefix and "f" not in next_prefix:
2966                 # Then we must escape any braces contained in this substring.
2967                 SS = re.subf(r"(\{|\})", "{1}{1}", SS)
2968
2969             NSS = make_naked(SS, next_prefix)
2970
2971             has_prefix = bool(next_prefix)
2972             prefix_tracker.append(has_prefix)
2973
2974             S = prefix + QUOTE + NS + NSS + BREAK_MARK + QUOTE
2975             NS = make_naked(S, prefix)
2976
2977             next_str_idx += 1
2978
2979         S_leaf = Leaf(token.STRING, S)
2980         if self.normalize_strings:
2981             normalize_string_quotes(S_leaf)
2982
2983         # Fill the 'custom_splits' list with the appropriate CustomSplit objects.
2984         temp_string = S_leaf.value[len(prefix) + 1 : -1]
2985         for has_prefix in prefix_tracker:
2986             mark_idx = temp_string.find(BREAK_MARK)
2987             assert (
2988                 mark_idx >= 0
2989             ), "Logic error while filling the custom string breakpoint cache."
2990
2991             temp_string = temp_string[mark_idx + len(BREAK_MARK) :]
2992             breakpoint_idx = mark_idx + (len(prefix) if has_prefix else 0) + 1
2993             custom_splits.append(CustomSplit(has_prefix, breakpoint_idx))
2994
2995         string_leaf = Leaf(token.STRING, S_leaf.value.replace(BREAK_MARK, ""))
2996
2997         if atom_node is not None:
2998             replace_child(atom_node, string_leaf)
2999
3000         # Build the final line ('new_line') that this method will later return.
3001         new_line = line.clone()
3002         for (i, leaf) in enumerate(LL):
3003             if i == string_idx:
3004                 new_line.append(string_leaf)
3005
3006             if string_idx <= i < string_idx + num_of_strings:
3007                 for comment_leaf in line.comments_after(LL[i]):
3008                     new_line.append(comment_leaf, preformatted=True)
3009                 continue
3010
3011             append_leaves(new_line, line, [leaf])
3012
3013         self.add_custom_splits(string_leaf.value, custom_splits)
3014         return Ok(new_line)
3015
3016     @staticmethod
3017     def __validate_msg(line: Line, string_idx: int) -> TResult[None]:
3018         """Validate (M)erge (S)tring (G)roup
3019
3020         Transform-time string validation logic for __merge_string_group(...).
3021
3022         Returns:
3023             * Ok(None), if ALL validation checks (listed below) pass.
3024                 OR
3025             * Err(CannotTransform), if any of the following are true:
3026                 - The target string is not in a string group (i.e. it has no
3027                   adjacent strings).
3028                 - The string group has more than one inline comment.
3029                 - The string group has an inline comment that appears to be a pragma.
3030                 - The set of all string prefixes in the string group is of
3031                   length greater than one and is not equal to {"", "f"}.
3032                 - The string group consists of raw strings.
3033         """
3034         num_of_inline_string_comments = 0
3035         set_of_prefixes = set()
3036         num_of_strings = 0
3037         for leaf in line.leaves[string_idx:]:
3038             if leaf.type != token.STRING:
3039                 # If the string group is trailed by a comma, we count the
3040                 # comments trailing the comma to be one of the string group's
3041                 # comments.
3042                 if leaf.type == token.COMMA and id(leaf) in line.comments:
3043                     num_of_inline_string_comments += 1
3044                 break
3045
3046             if has_triple_quotes(leaf.value):
3047                 return TErr("StringMerger does NOT merge multiline strings.")
3048
3049             num_of_strings += 1
3050             prefix = get_string_prefix(leaf.value)
3051             if "r" in prefix:
3052                 return TErr("StringMerger does NOT merge raw strings.")
3053
3054             set_of_prefixes.add(prefix)
3055
3056             if id(leaf) in line.comments:
3057                 num_of_inline_string_comments += 1
3058                 if contains_pragma_comment(line.comments[id(leaf)]):
3059                     return TErr("Cannot merge strings which have pragma comments.")
3060
3061         if num_of_strings < 2:
3062             return TErr(
3063                 f"Not enough strings to merge (num_of_strings={num_of_strings})."
3064             )
3065
3066         if num_of_inline_string_comments > 1:
3067             return TErr(
3068                 f"Too many inline string comments ({num_of_inline_string_comments})."
3069             )
3070
3071         if len(set_of_prefixes) > 1 and set_of_prefixes != {"", "f"}:
3072             return TErr(f"Too many different prefixes ({set_of_prefixes}).")
3073
3074         return Ok(None)
3075
3076
3077 class StringParenStripper(StringTransformer):
3078     """StringTransformer that strips surrounding parentheses from strings.
3079
3080     Requirements:
3081         The line contains a string which is surrounded by parentheses and:
3082             - The target string is NOT the only argument to a function call).
3083             - The RPAR is NOT followed by an attribute access (i.e. a dot).
3084
3085     Transformations:
3086         The parentheses mentioned in the 'Requirements' section are stripped.
3087
3088     Collaborations:
3089         StringParenStripper has its own inherent usefulness, but it is also
3090         relied on to clean up the parentheses created by StringParenWrapper (in
3091         the event that they are no longer needed).
3092     """
3093
3094     def do_match(self, line: Line) -> TMatchResult:
3095         LL = line.leaves
3096
3097         is_valid_index = is_valid_index_factory(LL)
3098
3099         for (idx, leaf) in enumerate(LL):
3100             # Should be a string...
3101             if leaf.type != token.STRING:
3102                 continue
3103
3104             # Should be preceded by a non-empty LPAR...
3105             if (
3106                 not is_valid_index(idx - 1)
3107                 or LL[idx - 1].type != token.LPAR
3108                 or is_empty_lpar(LL[idx - 1])
3109             ):
3110                 continue
3111
3112             # That LPAR should NOT be preceded by a function name or a closing
3113             # bracket (which could be a function which returns a function or a
3114             # list/dictionary that contains a function)...
3115             if is_valid_index(idx - 2) and (
3116                 LL[idx - 2].type == token.NAME or LL[idx - 2].type in CLOSING_BRACKETS
3117             ):
3118                 continue
3119
3120             string_idx = idx
3121
3122             # Skip the string trailer, if one exists.
3123             string_parser = StringParser()
3124             next_idx = string_parser.parse(LL, string_idx)
3125
3126             # Should be followed by a non-empty RPAR...
3127             if (
3128                 is_valid_index(next_idx)
3129                 and LL[next_idx].type == token.RPAR
3130                 and not is_empty_rpar(LL[next_idx])
3131             ):
3132                 # That RPAR should NOT be followed by a '.' symbol.
3133                 if is_valid_index(next_idx + 1) and LL[next_idx + 1].type == token.DOT:
3134                     continue
3135
3136                 return Ok(string_idx)
3137
3138         return TErr("This line has no strings wrapped in parens.")
3139
3140     def do_transform(self, line: Line, string_idx: int) -> Iterator[TResult[Line]]:
3141         LL = line.leaves
3142
3143         string_parser = StringParser()
3144         rpar_idx = string_parser.parse(LL, string_idx)
3145
3146         for leaf in (LL[string_idx - 1], LL[rpar_idx]):
3147             if line.comments_after(leaf):
3148                 yield TErr(
3149                     "Will not strip parentheses which have comments attached to them."
3150                 )
3151
3152         new_line = line.clone()
3153         new_line.comments = line.comments.copy()
3154
3155         append_leaves(new_line, line, LL[: string_idx - 1])
3156
3157         string_leaf = Leaf(token.STRING, LL[string_idx].value)
3158         LL[string_idx - 1].remove()
3159         replace_child(LL[string_idx], string_leaf)
3160         new_line.append(string_leaf)
3161
3162         append_leaves(
3163             new_line, line, LL[string_idx + 1 : rpar_idx] + LL[rpar_idx + 1 :],
3164         )
3165
3166         LL[rpar_idx].remove()
3167
3168         yield Ok(new_line)
3169
3170
3171 class BaseStringSplitter(StringTransformer):
3172     """
3173     Abstract class for StringTransformers which transform a Line's strings by splitting
3174     them or placing them on their own lines where necessary to avoid going over
3175     the configured line length.
3176
3177     Requirements:
3178         * The target string value is responsible for the line going over the
3179         line length limit. It follows that after all of black's other line
3180         split methods have been exhausted, this line (or one of the resulting
3181         lines after all line splits are performed) would still be over the
3182         line_length limit unless we split this string.
3183             AND
3184         * The target string is NOT a "pointless" string (i.e. a string that has
3185         no parent or siblings).
3186             AND
3187         * The target string is not followed by an inline comment that appears
3188         to be a pragma.
3189             AND
3190         * The target string is not a multiline (i.e. triple-quote) string.
3191     """
3192
3193     @abstractmethod
3194     def do_splitter_match(self, line: Line) -> TMatchResult:
3195         """
3196         BaseStringSplitter asks its clients to override this method instead of
3197         `StringTransformer.do_match(...)`.
3198
3199         Follows the same protocol as `StringTransformer.do_match(...)`.
3200
3201         Refer to `help(StringTransformer.do_match)` for more information.
3202         """
3203
3204     def do_match(self, line: Line) -> TMatchResult:
3205         match_result = self.do_splitter_match(line)
3206         if isinstance(match_result, Err):
3207             return match_result
3208
3209         string_idx = match_result.ok()
3210         vresult = self.__validate(line, string_idx)
3211         if isinstance(vresult, Err):
3212             return vresult
3213
3214         return match_result
3215
3216     def __validate(self, line: Line, string_idx: int) -> TResult[None]:
3217         """
3218         Checks that @line meets all of the requirements listed in this classes'
3219         docstring. Refer to `help(BaseStringSplitter)` for a detailed
3220         description of those requirements.
3221
3222         Returns:
3223             * Ok(None), if ALL of the requirements are met.
3224                 OR
3225             * Err(CannotTransform), if ANY of the requirements are NOT met.
3226         """
3227         LL = line.leaves
3228
3229         string_leaf = LL[string_idx]
3230
3231         max_string_length = self.__get_max_string_length(line, string_idx)
3232         if len(string_leaf.value) <= max_string_length:
3233             return TErr(
3234                 "The string itself is not what is causing this line to be too long."
3235             )
3236
3237         if not string_leaf.parent or [L.type for L in string_leaf.parent.children] == [
3238             token.STRING,
3239             token.NEWLINE,
3240         ]:
3241             return TErr(
3242                 f"This string ({string_leaf.value}) appears to be pointless (i.e. has"
3243                 " no parent)."
3244             )
3245
3246         if id(line.leaves[string_idx]) in line.comments and contains_pragma_comment(
3247             line.comments[id(line.leaves[string_idx])]
3248         ):
3249             return TErr(
3250                 "Line appears to end with an inline pragma comment. Splitting the line"
3251                 " could modify the pragma's behavior."
3252             )
3253
3254         if has_triple_quotes(string_leaf.value):
3255             return TErr("We cannot split multiline strings.")
3256
3257         return Ok(None)
3258
3259     def __get_max_string_length(self, line: Line, string_idx: int) -> int:
3260         """
3261         Calculates the max string length used when attempting to determine
3262         whether or not the target string is responsible for causing the line to
3263         go over the line length limit.
3264
3265         WARNING: This method is tightly coupled to both StringSplitter and
3266         (especially) StringParenWrapper. There is probably a better way to
3267         accomplish what is being done here.
3268
3269         Returns:
3270             max_string_length: such that `line.leaves[string_idx].value >
3271             max_string_length` implies that the target string IS responsible
3272             for causing this line to exceed the line length limit.
3273         """
3274         LL = line.leaves
3275
3276         is_valid_index = is_valid_index_factory(LL)
3277
3278         # We use the shorthand "WMA4" in comments to abbreviate "We must
3279         # account for". When giving examples, we use STRING to mean some/any
3280         # valid string.
3281         #
3282         # Finally, we use the following convenience variables:
3283         #
3284         #   P:  The leaf that is before the target string leaf.
3285         #   N:  The leaf that is after the target string leaf.
3286         #   NN: The leaf that is after N.
3287
3288         # WMA4 the whitespace at the beginning of the line.
3289         offset = line.depth * 4
3290
3291         if is_valid_index(string_idx - 1):
3292             p_idx = string_idx - 1
3293             if (
3294                 LL[string_idx - 1].type == token.LPAR
3295                 and LL[string_idx - 1].value == ""
3296                 and string_idx >= 2
3297             ):
3298                 # If the previous leaf is an empty LPAR placeholder, we should skip it.
3299                 p_idx -= 1
3300
3301             P = LL[p_idx]
3302             if P.type == token.PLUS:
3303                 # WMA4 a space and a '+' character (e.g. `+ STRING`).
3304                 offset += 2
3305
3306             if P.type == token.COMMA:
3307                 # WMA4 a space, a comma, and a closing bracket [e.g. `), STRING`].
3308                 offset += 3
3309
3310             if P.type in [token.COLON, token.EQUAL, token.NAME]:
3311                 # This conditional branch is meant to handle dictionary keys,
3312                 # variable assignments, 'return STRING' statement lines, and
3313                 # 'else STRING' ternary expression lines.
3314
3315                 # WMA4 a single space.
3316                 offset += 1
3317
3318                 # WMA4 the lengths of any leaves that came before that space.
3319                 for leaf in LL[: p_idx + 1]:
3320                     offset += len(str(leaf))
3321
3322         if is_valid_index(string_idx + 1):
3323             N = LL[string_idx + 1]
3324             if N.type == token.RPAR and N.value == "" and len(LL) > string_idx + 2:
3325                 # If the next leaf is an empty RPAR placeholder, we should skip it.
3326                 N = LL[string_idx + 2]
3327
3328             if N.type == token.COMMA:
3329                 # WMA4 a single comma at the end of the string (e.g `STRING,`).
3330                 offset += 1
3331
3332             if is_valid_index(string_idx + 2):
3333                 NN = LL[string_idx + 2]
3334
3335                 if N.type == token.DOT and NN.type == token.NAME:
3336                     # This conditional branch is meant to handle method calls invoked
3337                     # off of a string literal up to and including the LPAR character.
3338
3339                     # WMA4 the '.' character.
3340                     offset += 1
3341
3342                     if (
3343                         is_valid_index(string_idx + 3)
3344                         and LL[string_idx + 3].type == token.LPAR
3345                     ):
3346                         # WMA4 the left parenthesis character.
3347                         offset += 1
3348
3349                     # WMA4 the length of the method's name.
3350                     offset += len(NN.value)
3351
3352         has_comments = False
3353         for comment_leaf in line.comments_after(LL[string_idx]):
3354             if not has_comments:
3355                 has_comments = True
3356                 # WMA4 two spaces before the '#' character.
3357                 offset += 2
3358
3359             # WMA4 the length of the inline comment.
3360             offset += len(comment_leaf.value)
3361
3362         max_string_length = self.line_length - offset
3363         return max_string_length
3364
3365
3366 class StringSplitter(CustomSplitMapMixin, BaseStringSplitter):
3367     """
3368     StringTransformer that splits "atom" strings (i.e. strings which exist on
3369     lines by themselves).
3370
3371     Requirements:
3372         * The line consists ONLY of a single string (with the exception of a
3373         '+' symbol which MAY exist at the start of the line), MAYBE a string
3374         trailer, and MAYBE a trailing comma.
3375             AND
3376         * All of the requirements listed in BaseStringSplitter's docstring.
3377
3378     Transformations:
3379         The string mentioned in the 'Requirements' section is split into as
3380         many substrings as necessary to adhere to the configured line length.
3381
3382         In the final set of substrings, no substring should be smaller than
3383         MIN_SUBSTR_SIZE characters.
3384
3385         The string will ONLY be split on spaces (i.e. each new substring should
3386         start with a space).
3387
3388         If the string is an f-string, it will NOT be split in the middle of an
3389         f-expression (e.g. in f"FooBar: {foo() if x else bar()}", {foo() if x
3390         else bar()} is an f-expression).
3391
3392         If the string that is being split has an associated set of custom split
3393         records and those custom splits will NOT result in any line going over
3394         the configured line length, those custom splits are used. Otherwise the
3395         string is split as late as possible (from left-to-right) while still
3396         adhering to the transformation rules listed above.
3397
3398     Collaborations:
3399         StringSplitter relies on StringMerger to construct the appropriate
3400         CustomSplit objects and add them to the custom split map.
3401     """
3402
3403     MIN_SUBSTR_SIZE = 6
3404     # Matches an "f-expression" (e.g. {var}) that might be found in an f-string.
3405     RE_FEXPR = r"""
3406     (?<!\{)\{
3407         (?:
3408             [^\{\}]
3409             | \{\{
3410             | \}\}
3411         )+?
3412     (?<!\})(?:\}\})*\}(?!\})
3413     """
3414
3415     def do_splitter_match(self, line: Line) -> TMatchResult:
3416         LL = line.leaves
3417
3418         is_valid_index = is_valid_index_factory(LL)
3419
3420         idx = 0
3421
3422         # The first leaf MAY be a '+' symbol...
3423         if is_valid_index(idx) and LL[idx].type == token.PLUS:
3424             idx += 1
3425
3426         # The next/first leaf MAY be an empty LPAR...
3427         if is_valid_index(idx) and is_empty_lpar(LL[idx]):
3428             idx += 1
3429
3430         # The next/first leaf MUST be a string...
3431         if not is_valid_index(idx) or LL[idx].type != token.STRING:
3432             return TErr("Line does not start with a string.")
3433
3434         string_idx = idx
3435
3436         # Skip the string trailer, if one exists.
3437         string_parser = StringParser()
3438         idx = string_parser.parse(LL, string_idx)
3439
3440         # That string MAY be followed by an empty RPAR...
3441         if is_valid_index(idx) and is_empty_rpar(LL[idx]):
3442             idx += 1
3443
3444         # That string / empty RPAR leaf MAY be followed by a comma...
3445         if is_valid_index(idx) and LL[idx].type == token.COMMA:
3446             idx += 1
3447
3448         # But no more leaves are allowed...
3449         if is_valid_index(idx):
3450             return TErr("This line does not end with a string.")
3451
3452         return Ok(string_idx)
3453
3454     def do_transform(self, line: Line, string_idx: int) -> Iterator[TResult[Line]]:
3455         LL = line.leaves
3456
3457         QUOTE = LL[string_idx].value[-1]
3458
3459         is_valid_index = is_valid_index_factory(LL)
3460         insert_str_child = insert_str_child_factory(LL[string_idx])
3461
3462         prefix = get_string_prefix(LL[string_idx].value)
3463
3464         # We MAY choose to drop the 'f' prefix from substrings that don't
3465         # contain any f-expressions, but ONLY if the original f-string
3466         # containes at least one f-expression. Otherwise, we will alter the AST
3467         # of the program.
3468         drop_pointless_f_prefix = ("f" in prefix) and re.search(
3469             self.RE_FEXPR, LL[string_idx].value, re.VERBOSE
3470         )
3471
3472         first_string_line = True
3473         starts_with_plus = LL[0].type == token.PLUS
3474
3475         def line_needs_plus() -> bool:
3476             return first_string_line and starts_with_plus
3477
3478         def maybe_append_plus(new_line: Line) -> None:
3479             """
3480             Side Effects:
3481                 If @line starts with a plus and this is the first line we are
3482                 constructing, this function appends a PLUS leaf to @new_line
3483                 and replaces the old PLUS leaf in the node structure. Otherwise
3484                 this function does nothing.
3485             """
3486             if line_needs_plus():
3487                 plus_leaf = Leaf(token.PLUS, "+")
3488                 replace_child(LL[0], plus_leaf)
3489                 new_line.append(plus_leaf)
3490
3491         ends_with_comma = (
3492             is_valid_index(string_idx + 1) and LL[string_idx + 1].type == token.COMMA
3493         )
3494
3495         def max_last_string() -> int:
3496             """
3497             Returns:
3498                 The max allowed length of the string value used for the last
3499                 line we will construct.
3500             """
3501             result = self.line_length
3502             result -= line.depth * 4
3503             result -= 1 if ends_with_comma else 0
3504             result -= 2 if line_needs_plus() else 0
3505             return result
3506
3507         # --- Calculate Max Break Index (for string value)
3508         # We start with the line length limit
3509         max_break_idx = self.line_length
3510         # The last index of a string of length N is N-1.
3511         max_break_idx -= 1
3512         # Leading whitespace is not present in the string value (e.g. Leaf.value).
3513         max_break_idx -= line.depth * 4
3514         if max_break_idx < 0:
3515             yield TErr(
3516                 f"Unable to split {LL[string_idx].value} at such high of a line depth:"
3517                 f" {line.depth}"
3518             )
3519             return
3520
3521         # Check if StringMerger registered any custom splits.
3522         custom_splits = self.pop_custom_splits(LL[string_idx].value)
3523         # We use them ONLY if none of them would produce lines that exceed the
3524         # line limit.
3525         use_custom_breakpoints = bool(
3526             custom_splits
3527             and all(csplit.break_idx <= max_break_idx for csplit in custom_splits)
3528         )
3529
3530         # Temporary storage for the remaining chunk of the string line that
3531         # can't fit onto the line currently being constructed.
3532         rest_value = LL[string_idx].value
3533
3534         def more_splits_should_be_made() -> bool:
3535             """
3536             Returns:
3537                 True iff `rest_value` (the remaining string value from the last
3538                 split), should be split again.
3539             """
3540             if use_custom_breakpoints:
3541                 return len(custom_splits) > 1
3542             else:
3543                 return len(rest_value) > max_last_string()
3544
3545         string_line_results: List[Ok[Line]] = []
3546         while more_splits_should_be_made():
3547             if use_custom_breakpoints:
3548                 # Custom User Split (manual)
3549                 csplit = custom_splits.pop(0)
3550                 break_idx = csplit.break_idx
3551             else:
3552                 # Algorithmic Split (automatic)
3553                 max_bidx = max_break_idx - 2 if line_needs_plus() else max_break_idx
3554                 maybe_break_idx = self.__get_break_idx(rest_value, max_bidx)
3555                 if maybe_break_idx is None:
3556                     # If we are unable to algorthmically determine a good split
3557                     # and this string has custom splits registered to it, we
3558                     # fall back to using them--which means we have to start
3559                     # over from the beginning.
3560                     if custom_splits:
3561                         rest_value = LL[string_idx].value
3562                         string_line_results = []
3563                         first_string_line = True
3564                         use_custom_breakpoints = True
3565                         continue
3566
3567                     # Otherwise, we stop splitting here.
3568                     break
3569
3570                 break_idx = maybe_break_idx
3571
3572             # --- Construct `next_value`
3573             next_value = rest_value[:break_idx] + QUOTE
3574             if (
3575                 # Are we allowed to try to drop a pointless 'f' prefix?
3576                 drop_pointless_f_prefix
3577                 # If we are, will we be successful?
3578                 and next_value != self.__normalize_f_string(next_value, prefix)
3579             ):
3580                 # If the current custom split did NOT originally use a prefix,
3581                 # then `csplit.break_idx` will be off by one after removing
3582                 # the 'f' prefix.
3583                 break_idx = (
3584                     break_idx + 1
3585                     if use_custom_breakpoints and not csplit.has_prefix
3586                     else break_idx
3587                 )
3588                 next_value = rest_value[:break_idx] + QUOTE
3589                 next_value = self.__normalize_f_string(next_value, prefix)
3590
3591             # --- Construct `next_leaf`
3592             next_leaf = Leaf(token.STRING, next_value)
3593             insert_str_child(next_leaf)
3594             self.__maybe_normalize_string_quotes(next_leaf)
3595
3596             # --- Construct `next_line`
3597             next_line = line.clone()
3598             maybe_append_plus(next_line)
3599             next_line.append(next_leaf)
3600             string_line_results.append(Ok(next_line))
3601
3602             rest_value = prefix + QUOTE + rest_value[break_idx:]
3603             first_string_line = False
3604
3605         yield from string_line_results
3606
3607         if drop_pointless_f_prefix:
3608             rest_value = self.__normalize_f_string(rest_value, prefix)
3609
3610         rest_leaf = Leaf(token.STRING, rest_value)
3611         insert_str_child(rest_leaf)
3612
3613         # NOTE: I could not find a test case that verifies that the following
3614         # line is actually necessary, but it seems to be. Otherwise we risk
3615         # not normalizing the last substring, right?
3616         self.__maybe_normalize_string_quotes(rest_leaf)
3617
3618         last_line = line.clone()
3619         maybe_append_plus(last_line)
3620
3621         # If there are any leaves to the right of the target string...
3622         if is_valid_index(string_idx + 1):
3623             # We use `temp_value` here to determine how long the last line
3624             # would be if we were to append all the leaves to the right of the
3625             # target string to the last string line.
3626             temp_value = rest_value
3627             for leaf in LL[string_idx + 1 :]:
3628                 temp_value += str(leaf)
3629                 if leaf.type == token.LPAR:
3630                     break
3631
3632             # Try to fit them all on the same line with the last substring...
3633             if (
3634                 len(temp_value) <= max_last_string()
3635                 or LL[string_idx + 1].type == token.COMMA
3636             ):
3637                 last_line.append(rest_leaf)
3638                 append_leaves(last_line, line, LL[string_idx + 1 :])
3639                 yield Ok(last_line)
3640             # Otherwise, place the last substring on one line and everything
3641             # else on a line below that...
3642             else:
3643                 last_line.append(rest_leaf)
3644                 yield Ok(last_line)
3645
3646                 non_string_line = line.clone()
3647                 append_leaves(non_string_line, line, LL[string_idx + 1 :])
3648                 yield Ok(non_string_line)
3649         # Else the target string was the last leaf...
3650         else:
3651             last_line.append(rest_leaf)
3652             last_line.comments = line.comments.copy()
3653             yield Ok(last_line)
3654
3655     def __get_break_idx(self, string: str, max_break_idx: int) -> Optional[int]:
3656         """
3657         This method contains the algorithm that StringSplitter uses to
3658         determine which character to split each string at.
3659
3660         Args:
3661             @string: The substring that we are attempting to split.
3662             @max_break_idx: The ideal break index. We will return this value if it
3663             meets all the necessary conditions. In the likely event that it
3664             doesn't we will try to find the closest index BELOW @max_break_idx
3665             that does. If that fails, we will expand our search by also
3666             considering all valid indices ABOVE @max_break_idx.
3667
3668         Pre-Conditions:
3669             * assert_is_leaf_string(@string)
3670             * 0 <= @max_break_idx < len(@string)
3671
3672         Returns:
3673             break_idx, if an index is able to be found that meets all of the
3674             conditions listed in the 'Transformations' section of this classes'
3675             docstring.
3676                 OR
3677             None, otherwise.
3678         """
3679         is_valid_index = is_valid_index_factory(string)
3680
3681         assert is_valid_index(max_break_idx)
3682         assert_is_leaf_string(string)
3683
3684         _fexpr_slices: Optional[List[Tuple[Index, Index]]] = None
3685
3686         def fexpr_slices() -> Iterator[Tuple[Index, Index]]:
3687             """
3688             Yields:
3689                 All ranges of @string which, if @string were to be split there,
3690                 would result in the splitting of an f-expression (which is NOT
3691                 allowed).
3692             """
3693             nonlocal _fexpr_slices
3694
3695             if _fexpr_slices is None:
3696                 _fexpr_slices = []
3697                 for match in re.finditer(self.RE_FEXPR, string, re.VERBOSE):
3698                     _fexpr_slices.append(match.span())
3699
3700             yield from _fexpr_slices
3701
3702         is_fstring = "f" in get_string_prefix(string)
3703
3704         def breaks_fstring_expression(i: Index) -> bool:
3705             """
3706             Returns:
3707                 True iff returning @i would result in the splitting of an
3708                 f-expression (which is NOT allowed).
3709             """
3710             if not is_fstring:
3711                 return False
3712
3713             for (start, end) in fexpr_slices():
3714                 if start <= i < end:
3715                     return True
3716
3717             return False
3718
3719         def passes_all_checks(i: Index) -> bool:
3720             """
3721             Returns:
3722                 True iff ALL of the conditions listed in the 'Transformations'
3723                 section of this classes' docstring would be be met by returning @i.
3724             """
3725             is_space = string[i] == " "
3726             is_big_enough = (
3727                 len(string[i:]) >= self.MIN_SUBSTR_SIZE
3728                 and len(string[:i]) >= self.MIN_SUBSTR_SIZE
3729             )
3730             return is_space and is_big_enough and not breaks_fstring_expression(i)
3731
3732         # First, we check all indices BELOW @max_break_idx.
3733         break_idx = max_break_idx
3734         while is_valid_index(break_idx - 1) and not passes_all_checks(break_idx):
3735             break_idx -= 1
3736
3737         if not passes_all_checks(break_idx):
3738             # If that fails, we check all indices ABOVE @max_break_idx.
3739             #
3740             # If we are able to find a valid index here, the next line is going
3741             # to be longer than the specified line length, but it's probably
3742             # better than doing nothing at all.
3743             break_idx = max_break_idx + 1
3744             while is_valid_index(break_idx + 1) and not passes_all_checks(break_idx):
3745                 break_idx += 1
3746
3747             if not is_valid_index(break_idx) or not passes_all_checks(break_idx):
3748                 return None
3749
3750         return break_idx
3751
3752     def __maybe_normalize_string_quotes(self, leaf: Leaf) -> None:
3753         if self.normalize_strings:
3754             normalize_string_quotes(leaf)
3755
3756     def __normalize_f_string(self, string: str, prefix: str) -> str:
3757         """
3758         Pre-Conditions:
3759             * assert_is_leaf_string(@string)
3760
3761         Returns:
3762             * If @string is an f-string that contains no f-expressions, we
3763             return a string identical to @string except that the 'f' prefix
3764             has been stripped and all double braces (i.e. '{{' or '}}') have
3765             been normalized (i.e. turned into '{' or '}').
3766                 OR
3767             * Otherwise, we return @string.
3768         """
3769         assert_is_leaf_string(string)
3770
3771         if "f" in prefix and not re.search(self.RE_FEXPR, string, re.VERBOSE):
3772             new_prefix = prefix.replace("f", "")
3773
3774             temp = string[len(prefix) :]
3775             temp = re.sub(r"\{\{", "{", temp)
3776             temp = re.sub(r"\}\}", "}", temp)
3777             new_string = temp
3778
3779             return f"{new_prefix}{new_string}"
3780         else:
3781             return string
3782
3783
3784 class StringParenWrapper(CustomSplitMapMixin, BaseStringSplitter):
3785     """
3786     StringTransformer that splits non-"atom" strings (i.e. strings that do not
3787     exist on lines by themselves).
3788
3789     Requirements:
3790         All of the requirements listed in BaseStringSplitter's docstring in
3791         addition to the requirements listed below:
3792
3793         * The line is a return/yield statement, which returns/yields a string.
3794             OR
3795         * The line is part of a ternary expression (e.g. `x = y if cond else
3796         z`) such that the line starts with `else <string>`, where <string> is
3797         some string.
3798             OR
3799         * The line is an assert statement, which ends with a string.
3800             OR
3801         * The line is an assignment statement (e.g. `x = <string>` or `x +=
3802         <string>`) such that the variable is being assigned the value of some
3803         string.
3804             OR
3805         * The line is a dictionary key assignment where some valid key is being
3806         assigned the value of some string.
3807
3808     Transformations:
3809         The chosen string is wrapped in parentheses and then split at the LPAR.
3810
3811         We then have one line which ends with an LPAR and another line that
3812         starts with the chosen string. The latter line is then split again at
3813         the RPAR. This results in the RPAR (and possibly a trailing comma)
3814         being placed on its own line.
3815
3816         NOTE: If any leaves exist to the right of the chosen string (except
3817         for a trailing comma, which would be placed after the RPAR), those
3818         leaves are placed inside the parentheses.  In effect, the chosen
3819         string is not necessarily being "wrapped" by parentheses. We can,
3820         however, count on the LPAR being placed directly before the chosen
3821         string.
3822
3823         In other words, StringParenWrapper creates "atom" strings. These
3824         can then be split again by StringSplitter, if necessary.
3825
3826     Collaborations:
3827         In the event that a string line split by StringParenWrapper is
3828         changed such that it no longer needs to be given its own line,
3829         StringParenWrapper relies on StringParenStripper to clean up the
3830         parentheses it created.
3831     """
3832
3833     def do_splitter_match(self, line: Line) -> TMatchResult:
3834         LL = line.leaves
3835
3836         string_idx = None
3837         string_idx = string_idx or self._return_match(LL)
3838         string_idx = string_idx or self._else_match(LL)
3839         string_idx = string_idx or self._assert_match(LL)
3840         string_idx = string_idx or self._assign_match(LL)
3841         string_idx = string_idx or self._dict_match(LL)
3842
3843         if string_idx is not None:
3844             string_value = line.leaves[string_idx].value
3845             # If the string has no spaces...
3846             if " " not in string_value:
3847                 # And will still violate the line length limit when split...
3848                 max_string_length = self.line_length - ((line.depth + 1) * 4)
3849                 if len(string_value) > max_string_length:
3850                     # And has no associated custom splits...
3851                     if not self.has_custom_splits(string_value):
3852                         # Then we should NOT put this string on its own line.
3853                         return TErr(
3854                             "We do not wrap long strings in parentheses when the"
3855                             " resultant line would still be over the specified line"
3856                             " length and can't be split further by StringSplitter."
3857                         )
3858             return Ok(string_idx)
3859
3860         return TErr("This line does not contain any non-atomic strings.")
3861
3862     @staticmethod
3863     def _return_match(LL: List[Leaf]) -> Optional[int]:
3864         """
3865         Returns:
3866             string_idx such that @LL[string_idx] is equal to our target (i.e.
3867             matched) string, if this line matches the return/yield statement
3868             requirements listed in the 'Requirements' section of this classes'
3869             docstring.
3870                 OR
3871             None, otherwise.
3872         """
3873         # If this line is apart of a return/yield statement and the first leaf
3874         # contains either the "return" or "yield" keywords...
3875         if parent_type(LL[0]) in [syms.return_stmt, syms.yield_expr] and LL[
3876             0
3877         ].value in ["return", "yield"]:
3878             is_valid_index = is_valid_index_factory(LL)
3879
3880             idx = 2 if is_valid_index(1) and is_empty_par(LL[1]) else 1
3881             # The next visible leaf MUST contain a string...
3882             if is_valid_index(idx) and LL[idx].type == token.STRING:
3883                 return idx
3884
3885         return None
3886
3887     @staticmethod
3888     def _else_match(LL: List[Leaf]) -> Optional[int]:
3889         """
3890         Returns:
3891             string_idx such that @LL[string_idx] is equal to our target (i.e.
3892             matched) string, if this line matches the ternary expression
3893             requirements listed in the 'Requirements' section of this classes'
3894             docstring.
3895                 OR
3896             None, otherwise.
3897         """
3898         # If this line is apart of a ternary expression and the first leaf
3899         # contains the "else" keyword...
3900         if (
3901             parent_type(LL[0]) == syms.test
3902             and LL[0].type == token.NAME
3903             and LL[0].value == "else"
3904         ):
3905             is_valid_index = is_valid_index_factory(LL)
3906
3907             idx = 2 if is_valid_index(1) and is_empty_par(LL[1]) else 1
3908             # The next visible leaf MUST contain a string...
3909             if is_valid_index(idx) and LL[idx].type == token.STRING:
3910                 return idx
3911
3912         return None
3913
3914     @staticmethod
3915     def _assert_match(LL: List[Leaf]) -> Optional[int]:
3916         """
3917         Returns:
3918             string_idx such that @LL[string_idx] is equal to our target (i.e.
3919             matched) string, if this line matches the assert statement
3920             requirements listed in the 'Requirements' section of this classes'
3921             docstring.
3922                 OR
3923             None, otherwise.
3924         """
3925         # If this line is apart of an assert statement and the first leaf
3926         # contains the "assert" keyword...
3927         if parent_type(LL[0]) == syms.assert_stmt and LL[0].value == "assert":
3928             is_valid_index = is_valid_index_factory(LL)
3929
3930             for (i, leaf) in enumerate(LL):
3931                 # We MUST find a comma...
3932                 if leaf.type == token.COMMA:
3933                     idx = i + 2 if is_empty_par(LL[i + 1]) else i + 1
3934
3935                     # That comma MUST be followed by a string...
3936                     if is_valid_index(idx) and LL[idx].type == token.STRING:
3937                         string_idx = idx
3938
3939                         # Skip the string trailer, if one exists.
3940                         string_parser = StringParser()
3941                         idx = string_parser.parse(LL, string_idx)
3942
3943                         # But no more leaves are allowed...
3944                         if not is_valid_index(idx):
3945                             return string_idx
3946
3947         return None
3948
3949     @staticmethod
3950     def _assign_match(LL: List[Leaf]) -> Optional[int]:
3951         """
3952         Returns:
3953             string_idx such that @LL[string_idx] is equal to our target (i.e.
3954             matched) string, if this line matches the assignment statement
3955             requirements listed in the 'Requirements' section of this classes'
3956             docstring.
3957                 OR
3958             None, otherwise.
3959         """
3960         # If this line is apart of an expression statement or is a function
3961         # argument AND the first leaf contains a variable name...
3962         if (
3963             parent_type(LL[0]) in [syms.expr_stmt, syms.argument, syms.power]
3964             and LL[0].type == token.NAME
3965         ):
3966             is_valid_index = is_valid_index_factory(LL)
3967
3968             for (i, leaf) in enumerate(LL):
3969                 # We MUST find either an '=' or '+=' symbol...
3970                 if leaf.type in [token.EQUAL, token.PLUSEQUAL]:
3971                     idx = i + 2 if is_empty_par(LL[i + 1]) else i + 1
3972
3973                     # That symbol MUST be followed by a string...
3974                     if is_valid_index(idx) and LL[idx].type == token.STRING:
3975                         string_idx = idx
3976
3977                         # Skip the string trailer, if one exists.
3978                         string_parser = StringParser()
3979                         idx = string_parser.parse(LL, string_idx)
3980
3981                         # The next leaf MAY be a comma iff this line is apart
3982                         # of a function argument...
3983                         if (
3984                             parent_type(LL[0]) == syms.argument
3985                             and is_valid_index(idx)
3986                             and LL[idx].type == token.COMMA
3987                         ):
3988                             idx += 1
3989
3990                         # But no more leaves are allowed...
3991                         if not is_valid_index(idx):
3992                             return string_idx
3993
3994         return None
3995
3996     @staticmethod
3997     def _dict_match(LL: List[Leaf]) -> Optional[int]:
3998         """
3999         Returns:
4000             string_idx such that @LL[string_idx] is equal to our target (i.e.
4001             matched) string, if this line matches the dictionary key assignment
4002             statement requirements listed in the 'Requirements' section of this
4003             classes' docstring.
4004                 OR
4005             None, otherwise.
4006         """
4007         # If this line is apart of a dictionary key assignment...
4008         if syms.dictsetmaker in [parent_type(LL[0]), parent_type(LL[0].parent)]:
4009             is_valid_index = is_valid_index_factory(LL)
4010
4011             for (i, leaf) in enumerate(LL):
4012                 # We MUST find a colon...
4013                 if leaf.type == token.COLON:
4014                     idx = i + 2 if is_empty_par(LL[i + 1]) else i + 1
4015
4016                     # That colon MUST be followed by a string...
4017                     if is_valid_index(idx) and LL[idx].type == token.STRING:
4018                         string_idx = idx
4019
4020                         # Skip the string trailer, if one exists.
4021                         string_parser = StringParser()
4022                         idx = string_parser.parse(LL, string_idx)
4023
4024                         # That string MAY be followed by a comma...
4025                         if is_valid_index(idx) and LL[idx].type == token.COMMA:
4026                             idx += 1
4027
4028                         # But no more leaves are allowed...
4029                         if not is_valid_index(idx):
4030                             return string_idx
4031
4032         return None
4033
4034     def do_transform(self, line: Line, string_idx: int) -> Iterator[TResult[Line]]:
4035         LL = line.leaves
4036
4037         is_valid_index = is_valid_index_factory(LL)
4038         insert_str_child = insert_str_child_factory(LL[string_idx])
4039
4040         comma_idx = len(LL) - 1
4041         ends_with_comma = False
4042         if LL[comma_idx].type == token.COMMA:
4043             ends_with_comma = True
4044
4045         leaves_to_steal_comments_from = [LL[string_idx]]
4046         if ends_with_comma:
4047             leaves_to_steal_comments_from.append(LL[comma_idx])
4048
4049         # --- First Line
4050         first_line = line.clone()
4051         left_leaves = LL[:string_idx]
4052
4053         # We have to remember to account for (possibly invisible) LPAR and RPAR
4054         # leaves that already wrapped the target string. If these leaves do
4055         # exist, we will replace them with our own LPAR and RPAR leaves.
4056         old_parens_exist = False
4057         if left_leaves and left_leaves[-1].type == token.LPAR:
4058             old_parens_exist = True
4059             leaves_to_steal_comments_from.append(left_leaves[-1])
4060             left_leaves.pop()
4061
4062         append_leaves(first_line, line, left_leaves)
4063
4064         lpar_leaf = Leaf(token.LPAR, "(")
4065         if old_parens_exist:
4066             replace_child(LL[string_idx - 1], lpar_leaf)
4067         else:
4068             insert_str_child(lpar_leaf)
4069         first_line.append(lpar_leaf)
4070
4071         # We throw inline comments that were originally to the right of the
4072         # target string to the top line. They will now be shown to the right of
4073         # the LPAR.
4074         for leaf in leaves_to_steal_comments_from:
4075             for comment_leaf in line.comments_after(leaf):
4076                 first_line.append(comment_leaf, preformatted=True)
4077
4078         yield Ok(first_line)
4079
4080         # --- Middle (String) Line
4081         # We only need to yield one (possibly too long) string line, since the
4082         # `StringSplitter` will break it down further if necessary.
4083         string_value = LL[string_idx].value
4084         string_line = Line(
4085             depth=line.depth + 1,
4086             inside_brackets=True,
4087             should_explode=line.should_explode,
4088         )
4089         string_leaf = Leaf(token.STRING, string_value)
4090         insert_str_child(string_leaf)
4091         string_line.append(string_leaf)
4092
4093         old_rpar_leaf = None
4094         if is_valid_index(string_idx + 1):
4095             right_leaves = LL[string_idx + 1 :]
4096             if ends_with_comma:
4097                 right_leaves.pop()
4098
4099             if old_parens_exist:
4100                 assert (
4101                     right_leaves and right_leaves[-1].type == token.RPAR
4102                 ), "Apparently, old parentheses do NOT exist?!"
4103                 old_rpar_leaf = right_leaves.pop()
4104
4105             append_leaves(string_line, line, right_leaves)
4106
4107         yield Ok(string_line)
4108
4109         # --- Last Line
4110         last_line = line.clone()
4111         last_line.bracket_tracker = first_line.bracket_tracker
4112
4113         new_rpar_leaf = Leaf(token.RPAR, ")")
4114         if old_rpar_leaf is not None:
4115             replace_child(old_rpar_leaf, new_rpar_leaf)
4116         else:
4117             insert_str_child(new_rpar_leaf)
4118         last_line.append(new_rpar_leaf)
4119
4120         # If the target string ended with a comma, we place this comma to the
4121         # right of the RPAR on the last line.
4122         if ends_with_comma:
4123             comma_leaf = Leaf(token.COMMA, ",")
4124             replace_child(LL[comma_idx], comma_leaf)
4125             last_line.append(comma_leaf)
4126
4127         yield Ok(last_line)
4128
4129
4130 class StringParser:
4131     """
4132     A state machine that aids in parsing a string's "trailer", which can be
4133     either non-existant, an old-style formatting sequence (e.g. `% varX` or `%
4134     (varX, varY)`), or a method-call / attribute access (e.g. `.format(varX,
4135     varY)`).
4136
4137     NOTE: A new StringParser object MUST be instantiated for each string
4138     trailer we need to parse.
4139
4140     Examples:
4141         We shall assume that `line` equals the `Line` object that corresponds
4142         to the following line of python code:
4143         ```
4144         x = "Some {}.".format("String") + some_other_string
4145         ```
4146
4147         Furthermore, we will assume that `string_idx` is some index such that:
4148         ```
4149         assert line.leaves[string_idx].value == "Some {}."
4150         ```
4151
4152         The following code snippet then holds:
4153         ```
4154         string_parser = StringParser()
4155         idx = string_parser.parse(line.leaves, string_idx)
4156         assert line.leaves[idx].type == token.PLUS
4157         ```
4158     """
4159
4160     DEFAULT_TOKEN = -1
4161
4162     # String Parser States
4163     START = 1
4164     DOT = 2
4165     NAME = 3
4166     PERCENT = 4
4167     SINGLE_FMT_ARG = 5
4168     LPAR = 6
4169     RPAR = 7
4170     DONE = 8
4171
4172     # Lookup Table for Next State
4173     _goto: Dict[Tuple[ParserState, NodeType], ParserState] = {
4174         # A string trailer may start with '.' OR '%'.
4175         (START, token.DOT): DOT,
4176         (START, token.PERCENT): PERCENT,
4177         (START, DEFAULT_TOKEN): DONE,
4178         # A '.' MUST be followed by an attribute or method name.
4179         (DOT, token.NAME): NAME,
4180         # A method name MUST be followed by an '(', whereas an attribute name
4181         # is the last symbol in the string trailer.
4182         (NAME, token.LPAR): LPAR,
4183         (NAME, DEFAULT_TOKEN): DONE,
4184         # A '%' symbol can be followed by an '(' or a single argument (e.g. a
4185         # string or variable name).
4186         (PERCENT, token.LPAR): LPAR,
4187         (PERCENT, DEFAULT_TOKEN): SINGLE_FMT_ARG,
4188         # If a '%' symbol is followed by a single argument, that argument is
4189         # the last leaf in the string trailer.
4190         (SINGLE_FMT_ARG, DEFAULT_TOKEN): DONE,
4191         # If present, a ')' symbol is the last symbol in a string trailer.
4192         # (NOTE: LPARS and nested RPARS are not included in this lookup table,
4193         # since they are treated as a special case by the parsing logic in this
4194         # classes' implementation.)
4195         (RPAR, DEFAULT_TOKEN): DONE,
4196     }
4197
4198     def __init__(self) -> None:
4199         self._state = self.START
4200         self._unmatched_lpars = 0
4201
4202     def parse(self, leaves: List[Leaf], string_idx: int) -> int:
4203         """
4204         Pre-conditions:
4205             * @leaves[@string_idx].type == token.STRING
4206
4207         Returns:
4208             The index directly after the last leaf which is apart of the string
4209             trailer, if a "trailer" exists.
4210                 OR
4211             @string_idx + 1, if no string "trailer" exists.
4212         """
4213         assert leaves[string_idx].type == token.STRING
4214
4215         idx = string_idx + 1
4216         while idx < len(leaves) and self._next_state(leaves[idx]):
4217             idx += 1
4218         return idx
4219
4220     def _next_state(self, leaf: Leaf) -> bool:
4221         """
4222         Pre-conditions:
4223             * On the first call to this function, @leaf MUST be the leaf that
4224             was directly after the string leaf in question (e.g. if our target
4225             string is `line.leaves[i]` then the first call to this method must
4226             be `line.leaves[i + 1]`).
4227             * On the next call to this function, the leaf paramater passed in
4228             MUST be the leaf directly following @leaf.
4229
4230         Returns:
4231             True iff @leaf is apart of the string's trailer.
4232         """
4233         # We ignore empty LPAR or RPAR leaves.
4234         if is_empty_par(leaf):
4235             return True
4236
4237         next_token = leaf.type
4238         if next_token == token.LPAR:
4239             self._unmatched_lpars += 1
4240
4241         current_state = self._state
4242
4243         # The LPAR parser state is a special case. We will return True until we
4244         # find the matching RPAR token.
4245         if current_state == self.LPAR:
4246             if next_token == token.RPAR:
4247                 self._unmatched_lpars -= 1
4248                 if self._unmatched_lpars == 0:
4249                     self._state = self.RPAR
4250         # Otherwise, we use a lookup table to determine the next state.
4251         else:
4252             # If the lookup table matches the current state to the next
4253             # token, we use the lookup table.
4254             if (current_state, next_token) in self._goto:
4255                 self._state = self._goto[current_state, next_token]
4256             else:
4257                 # Otherwise, we check if a the current state was assigned a
4258                 # default.
4259                 if (current_state, self.DEFAULT_TOKEN) in self._goto:
4260                     self._state = self._goto[current_state, self.DEFAULT_TOKEN]
4261                 # If no default has been assigned, then this parser has a logic
4262                 # error.
4263                 else:
4264                     raise RuntimeError(f"{self.__class__.__name__} LOGIC ERROR!")
4265
4266             if self._state == self.DONE:
4267                 return False
4268
4269         return True
4270
4271
4272 def TErr(err_msg: str) -> Err[CannotTransform]:
4273     """(T)ransform Err
4274
4275     Convenience function used when working with the TResult type.
4276     """
4277     cant_transform = CannotTransform(err_msg)
4278     return Err(cant_transform)
4279
4280
4281 def contains_pragma_comment(comment_list: List[Leaf]) -> bool:
4282     """
4283     Returns:
4284         True iff one of the comments in @comment_list is a pragma used by one
4285         of the more common static analysis tools for python (e.g. mypy, flake8,
4286         pylint).
4287     """
4288     for comment in comment_list:
4289         if comment.value.startswith(("# type:", "# noqa", "# pylint:")):
4290             return True
4291
4292     return False
4293
4294
4295 def insert_str_child_factory(string_leaf: Leaf) -> Callable[[LN], None]:
4296     """
4297     Factory for a convenience function that is used to orphan @string_leaf
4298     and then insert multiple new leaves into the same part of the node
4299     structure that @string_leaf had originally occupied.
4300
4301     Examples:
4302         Let `string_leaf = Leaf(token.STRING, '"foo"')` and `N =
4303         string_leaf.parent`. Assume the node `N` has the following
4304         original structure:
4305
4306         Node(
4307             expr_stmt, [
4308                 Leaf(NAME, 'x'),
4309                 Leaf(EQUAL, '='),
4310                 Leaf(STRING, '"foo"'),
4311             ]
4312         )
4313
4314         We then run the code snippet shown below.
4315         ```
4316         insert_str_child = insert_str_child_factory(string_leaf)
4317
4318         lpar = Leaf(token.LPAR, '(')
4319         insert_str_child(lpar)
4320
4321         bar = Leaf(token.STRING, '"bar"')
4322         insert_str_child(bar)
4323
4324         rpar = Leaf(token.RPAR, ')')
4325         insert_str_child(rpar)
4326         ```
4327
4328         After which point, it follows that `string_leaf.parent is None` and
4329         the node `N` now has the following structure:
4330
4331         Node(
4332             expr_stmt, [
4333                 Leaf(NAME, 'x'),
4334                 Leaf(EQUAL, '='),
4335                 Leaf(LPAR, '('),
4336                 Leaf(STRING, '"bar"'),
4337                 Leaf(RPAR, ')'),
4338             ]
4339         )
4340     """
4341     string_parent = string_leaf.parent
4342     string_child_idx = string_leaf.remove()
4343
4344     def insert_str_child(child: LN) -> None:
4345         nonlocal string_child_idx
4346
4347         assert string_parent is not None
4348         assert string_child_idx is not None
4349
4350         string_parent.insert_child(string_child_idx, child)
4351         string_child_idx += 1
4352
4353     return insert_str_child
4354
4355
4356 def has_triple_quotes(string: str) -> bool:
4357     """
4358     Returns:
4359         True iff @string starts with three quotation characters.
4360     """
4361     raw_string = string.lstrip(STRING_PREFIX_CHARS)
4362     return raw_string[:3] in {'"""', "'''"}
4363
4364
4365 def parent_type(node: Optional[LN]) -> Optional[NodeType]:
4366     """
4367     Returns:
4368         @node.parent.type, if @node is not None and has a parent.
4369             OR
4370         None, otherwise.
4371     """
4372     if node is None or node.parent is None:
4373         return None
4374
4375     return node.parent.type
4376
4377
4378 def is_empty_par(leaf: Leaf) -> bool:
4379     return is_empty_lpar(leaf) or is_empty_rpar(leaf)
4380
4381
4382 def is_empty_lpar(leaf: Leaf) -> bool:
4383     return leaf.type == token.LPAR and leaf.value == ""
4384
4385
4386 def is_empty_rpar(leaf: Leaf) -> bool:
4387     return leaf.type == token.RPAR and leaf.value == ""
4388
4389
4390 def is_valid_index_factory(seq: Sequence[Any]) -> Callable[[int], bool]:
4391     """
4392     Examples:
4393         ```
4394         my_list = [1, 2, 3]
4395
4396         is_valid_index = is_valid_index_factory(my_list)
4397
4398         assert is_valid_index(0)
4399         assert is_valid_index(2)
4400
4401         assert not is_valid_index(3)
4402         assert not is_valid_index(-1)
4403         ```
4404     """
4405
4406     def is_valid_index(idx: int) -> bool:
4407         """
4408         Returns:
4409             True iff @idx is positive AND seq[@idx] does NOT raise an
4410             IndexError.
4411         """
4412         return 0 <= idx < len(seq)
4413
4414     return is_valid_index
4415
4416
4417 def line_to_string(line: Line) -> str:
4418     """Returns the string representation of @line.
4419
4420     WARNING: This is known to be computationally expensive.
4421     """
4422     return str(line).strip("\n")
4423
4424
4425 def append_leaves(new_line: Line, old_line: Line, leaves: List[Leaf]) -> None:
4426     """
4427     Append leaves (taken from @old_line) to @new_line, making sure to fix the
4428     underlying Node structure where appropriate.
4429
4430     All of the leaves in @leaves are duplicated. The duplicates are then
4431     appended to @new_line and used to replace their originals in the underlying
4432     Node structure. Any comments attatched to the old leaves are reattached to
4433     the new leaves.
4434
4435     Pre-conditions:
4436         set(@leaves) is a subset of set(@old_line.leaves).
4437     """
4438     for old_leaf in leaves:
4439         assert old_leaf in old_line.leaves
4440
4441         new_leaf = Leaf(old_leaf.type, old_leaf.value)
4442         replace_child(old_leaf, new_leaf)
4443         new_line.append(new_leaf)
4444
4445         for comment_leaf in old_line.comments_after(old_leaf):
4446             new_line.append(comment_leaf, preformatted=True)
4447
4448
4449 def replace_child(old_child: LN, new_child: LN) -> None:
4450     """
4451     Side Effects:
4452         * If @old_child.parent is set, replace @old_child with @new_child in
4453         @old_child's underlying Node structure.
4454             OR
4455         * Otherwise, this function does nothing.
4456     """
4457     parent = old_child.parent
4458     if not parent:
4459         return
4460
4461     child_idx = old_child.remove()
4462     if child_idx is not None:
4463         parent.insert_child(child_idx, new_child)
4464
4465
4466 def get_string_prefix(string: str) -> str:
4467     """
4468     Pre-conditions:
4469         * assert_is_leaf_string(@string)
4470
4471     Returns:
4472         @string's prefix (e.g. '', 'r', 'f', or 'rf').
4473     """
4474     assert_is_leaf_string(string)
4475
4476     prefix = ""
4477     prefix_idx = 0
4478     while string[prefix_idx] in STRING_PREFIX_CHARS:
4479         prefix += string[prefix_idx].lower()
4480         prefix_idx += 1
4481
4482     return prefix
4483
4484
4485 def assert_is_leaf_string(string: str) -> None:
4486     """
4487     Checks the pre-condition that @string has the format that you would expect
4488     of `leaf.value` where `leaf` is some Leaf such that `leaf.type ==
4489     token.STRING`. A more precise description of the pre-conditions that are
4490     checked are listed below.
4491
4492     Pre-conditions:
4493         * @string starts with either ', ", <prefix>', or <prefix>" where
4494         `set(<prefix>)` is some subset of `set(STRING_PREFIX_CHARS)`.
4495         * @string ends with a quote character (' or ").
4496
4497     Raises:
4498         AssertionError(...) if the pre-conditions listed above are not
4499         satisfied.
4500     """
4501     dquote_idx = string.find('"')
4502     squote_idx = string.find("'")
4503     if -1 in [dquote_idx, squote_idx]:
4504         quote_idx = max(dquote_idx, squote_idx)
4505     else:
4506         quote_idx = min(squote_idx, dquote_idx)
4507
4508     assert (
4509         0 <= quote_idx < len(string) - 1
4510     ), f"{string!r} is missing a starting quote character (' or \")."
4511     assert string[-1] in (
4512         "'",
4513         '"',
4514     ), f"{string!r} is missing an ending quote character (' or \")."
4515     assert set(string[:quote_idx]).issubset(
4516         set(STRING_PREFIX_CHARS)
4517     ), f"{set(string[:quote_idx])} is NOT a subset of {set(STRING_PREFIX_CHARS)}."
4518
4519
4520 def left_hand_split(line: Line, _features: Collection[Feature] = ()) -> Iterator[Line]:
4521     """Split line into many lines, starting with the first matching bracket pair.
4522
4523     Note: this usually looks weird, only use this for function definitions.
4524     Prefer RHS otherwise.  This is why this function is not symmetrical with
4525     :func:`right_hand_split` which also handles optional parentheses.
4526     """
4527     tail_leaves: List[Leaf] = []
4528     body_leaves: List[Leaf] = []
4529     head_leaves: List[Leaf] = []
4530     current_leaves = head_leaves
4531     matching_bracket: Optional[Leaf] = None
4532     for leaf in line.leaves:
4533         if (
4534             current_leaves is body_leaves
4535             and leaf.type in CLOSING_BRACKETS
4536             and leaf.opening_bracket is matching_bracket
4537         ):
4538             current_leaves = tail_leaves if body_leaves else head_leaves
4539         current_leaves.append(leaf)
4540         if current_leaves is head_leaves:
4541             if leaf.type in OPENING_BRACKETS:
4542                 matching_bracket = leaf
4543                 current_leaves = body_leaves
4544     if not matching_bracket:
4545         raise CannotSplit("No brackets found")
4546
4547     head = bracket_split_build_line(head_leaves, line, matching_bracket)
4548     body = bracket_split_build_line(body_leaves, line, matching_bracket, is_body=True)
4549     tail = bracket_split_build_line(tail_leaves, line, matching_bracket)
4550     bracket_split_succeeded_or_raise(head, body, tail)
4551     for result in (head, body, tail):
4552         if result:
4553             yield result
4554
4555
4556 def right_hand_split(
4557     line: Line,
4558     line_length: int,
4559     features: Collection[Feature] = (),
4560     omit: Collection[LeafID] = (),
4561 ) -> Iterator[Line]:
4562     """Split line into many lines, starting with the last matching bracket pair.
4563
4564     If the split was by optional parentheses, attempt splitting without them, too.
4565     `omit` is a collection of closing bracket IDs that shouldn't be considered for
4566     this split.
4567
4568     Note: running this function modifies `bracket_depth` on the leaves of `line`.
4569     """
4570     tail_leaves: List[Leaf] = []
4571     body_leaves: List[Leaf] = []
4572     head_leaves: List[Leaf] = []
4573     current_leaves = tail_leaves
4574     opening_bracket: Optional[Leaf] = None
4575     closing_bracket: Optional[Leaf] = None
4576     for leaf in reversed(line.leaves):
4577         if current_leaves is body_leaves:
4578             if leaf is opening_bracket:
4579                 current_leaves = head_leaves if body_leaves else tail_leaves
4580         current_leaves.append(leaf)
4581         if current_leaves is tail_leaves:
4582             if leaf.type in CLOSING_BRACKETS and id(leaf) not in omit:
4583                 opening_bracket = leaf.opening_bracket
4584                 closing_bracket = leaf
4585                 current_leaves = body_leaves
4586     if not (opening_bracket and closing_bracket and head_leaves):
4587         # If there is no opening or closing_bracket that means the split failed and
4588         # all content is in the tail.  Otherwise, if `head_leaves` are empty, it means
4589         # the matching `opening_bracket` wasn't available on `line` anymore.
4590         raise CannotSplit("No brackets found")
4591
4592     tail_leaves.reverse()
4593     body_leaves.reverse()
4594     head_leaves.reverse()
4595     head = bracket_split_build_line(head_leaves, line, opening_bracket)
4596     body = bracket_split_build_line(body_leaves, line, opening_bracket, is_body=True)
4597     tail = bracket_split_build_line(tail_leaves, line, opening_bracket)
4598     bracket_split_succeeded_or_raise(head, body, tail)
4599     if (
4600         # the body shouldn't be exploded
4601         not body.should_explode
4602         # the opening bracket is an optional paren
4603         and opening_bracket.type == token.LPAR
4604         and not opening_bracket.value
4605         # the closing bracket is an optional paren
4606         and closing_bracket.type == token.RPAR
4607         and not closing_bracket.value
4608         # it's not an import (optional parens are the only thing we can split on
4609         # in this case; attempting a split without them is a waste of time)
4610         and not line.is_import
4611         # there are no standalone comments in the body
4612         and not body.contains_standalone_comments(0)
4613         # and we can actually remove the parens
4614         and can_omit_invisible_parens(body, line_length)
4615     ):
4616         omit = {id(closing_bracket), *omit}
4617         try:
4618             yield from right_hand_split(line, line_length, features=features, omit=omit)
4619             return
4620
4621         except CannotSplit:
4622             if not (
4623                 can_be_split(body)
4624                 or is_line_short_enough(body, line_length=line_length)
4625             ):
4626                 raise CannotSplit(
4627                     "Splitting failed, body is still too long and can't be split."
4628                 )
4629
4630             elif head.contains_multiline_strings() or tail.contains_multiline_strings():
4631                 raise CannotSplit(
4632                     "The current optional pair of parentheses is bound to fail to"
4633                     " satisfy the splitting algorithm because the head or the tail"
4634                     " contains multiline strings which by definition never fit one"
4635                     " line."
4636                 )
4637
4638     ensure_visible(opening_bracket)
4639     ensure_visible(closing_bracket)
4640     for result in (head, body, tail):
4641         if result:
4642             yield result
4643
4644
4645 def bracket_split_succeeded_or_raise(head: Line, body: Line, tail: Line) -> None:
4646     """Raise :exc:`CannotSplit` if the last left- or right-hand split failed.
4647
4648     Do nothing otherwise.
4649
4650     A left- or right-hand split is based on a pair of brackets. Content before
4651     (and including) the opening bracket is left on one line, content inside the
4652     brackets is put on a separate line, and finally content starting with and
4653     following the closing bracket is put on a separate line.
4654
4655     Those are called `head`, `body`, and `tail`, respectively. If the split
4656     produced the same line (all content in `head`) or ended up with an empty `body`
4657     and the `tail` is just the closing bracket, then it's considered failed.
4658     """
4659     tail_len = len(str(tail).strip())
4660     if not body:
4661         if tail_len == 0:
4662             raise CannotSplit("Splitting brackets produced the same line")
4663
4664         elif tail_len < 3:
4665             raise CannotSplit(
4666                 f"Splitting brackets on an empty body to save {tail_len} characters is"
4667                 " not worth it"
4668             )
4669
4670
4671 def bracket_split_build_line(
4672     leaves: List[Leaf], original: Line, opening_bracket: Leaf, *, is_body: bool = False
4673 ) -> Line:
4674     """Return a new line with given `leaves` and respective comments from `original`.
4675
4676     If `is_body` is True, the result line is one-indented inside brackets and as such
4677     has its first leaf's prefix normalized and a trailing comma added when expected.
4678     """
4679     result = Line(depth=original.depth)
4680     if is_body:
4681         result.inside_brackets = True
4682         result.depth += 1
4683         if leaves:
4684             # Since body is a new indent level, remove spurious leading whitespace.
4685             normalize_prefix(leaves[0], inside_brackets=True)
4686             # Ensure a trailing comma for imports and standalone function arguments, but
4687             # be careful not to add one after any comments or within type annotations.
4688             no_commas = (
4689                 original.is_def
4690                 and opening_bracket.value == "("
4691                 and not any(l.type == token.COMMA for l in leaves)
4692             )
4693
4694             if original.is_import or no_commas:
4695                 for i in range(len(leaves) - 1, -1, -1):
4696                     if leaves[i].type == STANDALONE_COMMENT:
4697                         continue
4698
4699                     if leaves[i].type != token.COMMA:
4700                         leaves.insert(i + 1, Leaf(token.COMMA, ","))
4701                     break
4702
4703     # Populate the line
4704     for leaf in leaves:
4705         result.append(leaf, preformatted=True)
4706         for comment_after in original.comments_after(leaf):
4707             result.append(comment_after, preformatted=True)
4708     if is_body:
4709         result.should_explode = should_explode(result, opening_bracket)
4710     return result
4711
4712
4713 def dont_increase_indentation(split_func: Transformer) -> Transformer:
4714     """Normalize prefix of the first leaf in every line returned by `split_func`.
4715
4716     This is a decorator over relevant split functions.
4717     """
4718
4719     @wraps(split_func)
4720     def split_wrapper(line: Line, features: Collection[Feature] = ()) -> Iterator[Line]:
4721         for l in split_func(line, features):
4722             normalize_prefix(l.leaves[0], inside_brackets=True)
4723             yield l
4724
4725     return split_wrapper
4726
4727
4728 @dont_increase_indentation
4729 def delimiter_split(line: Line, features: Collection[Feature] = ()) -> Iterator[Line]:
4730     """Split according to delimiters of the highest priority.
4731
4732     If the appropriate Features are given, the split will add trailing commas
4733     also in function signatures and calls that contain `*` and `**`.
4734     """
4735     try:
4736         last_leaf = line.leaves[-1]
4737     except IndexError:
4738         raise CannotSplit("Line empty")
4739
4740     bt = line.bracket_tracker
4741     try:
4742         delimiter_priority = bt.max_delimiter_priority(exclude={id(last_leaf)})
4743     except ValueError:
4744         raise CannotSplit("No delimiters found")
4745
4746     if delimiter_priority == DOT_PRIORITY:
4747         if bt.delimiter_count_with_priority(delimiter_priority) == 1:
4748             raise CannotSplit("Splitting a single attribute from its owner looks wrong")
4749
4750     current_line = Line(depth=line.depth, inside_brackets=line.inside_brackets)
4751     lowest_depth = sys.maxsize
4752     trailing_comma_safe = True
4753
4754     def append_to_line(leaf: Leaf) -> Iterator[Line]:
4755         """Append `leaf` to current line or to new line if appending impossible."""
4756         nonlocal current_line
4757         try:
4758             current_line.append_safe(leaf, preformatted=True)
4759         except ValueError:
4760             yield current_line
4761
4762             current_line = Line(depth=line.depth, inside_brackets=line.inside_brackets)
4763             current_line.append(leaf)
4764
4765     for leaf in line.leaves:
4766         yield from append_to_line(leaf)
4767
4768         for comment_after in line.comments_after(leaf):
4769             yield from append_to_line(comment_after)
4770
4771         lowest_depth = min(lowest_depth, leaf.bracket_depth)
4772         if leaf.bracket_depth == lowest_depth:
4773             if is_vararg(leaf, within={syms.typedargslist}):
4774                 trailing_comma_safe = (
4775                     trailing_comma_safe and Feature.TRAILING_COMMA_IN_DEF in features
4776                 )
4777             elif is_vararg(leaf, within={syms.arglist, syms.argument}):
4778                 trailing_comma_safe = (
4779                     trailing_comma_safe and Feature.TRAILING_COMMA_IN_CALL in features
4780                 )
4781
4782         leaf_priority = bt.delimiters.get(id(leaf))
4783         if leaf_priority == delimiter_priority:
4784             yield current_line
4785
4786             current_line = Line(depth=line.depth, inside_brackets=line.inside_brackets)
4787     if current_line:
4788         if (
4789             trailing_comma_safe
4790             and delimiter_priority == COMMA_PRIORITY
4791             and current_line.leaves[-1].type != token.COMMA
4792             and current_line.leaves[-1].type != STANDALONE_COMMENT
4793         ):
4794             current_line.append(Leaf(token.COMMA, ","))
4795         yield current_line
4796
4797
4798 @dont_increase_indentation
4799 def standalone_comment_split(
4800     line: Line, features: Collection[Feature] = ()
4801 ) -> Iterator[Line]:
4802     """Split standalone comments from the rest of the line."""
4803     if not line.contains_standalone_comments(0):
4804         raise CannotSplit("Line does not have any standalone comments")
4805
4806     current_line = Line(depth=line.depth, inside_brackets=line.inside_brackets)
4807
4808     def append_to_line(leaf: Leaf) -> Iterator[Line]:
4809         """Append `leaf` to current line or to new line if appending impossible."""
4810         nonlocal current_line
4811         try:
4812             current_line.append_safe(leaf, preformatted=True)
4813         except ValueError:
4814             yield current_line
4815
4816             current_line = Line(depth=line.depth, inside_brackets=line.inside_brackets)
4817             current_line.append(leaf)
4818
4819     for leaf in line.leaves:
4820         yield from append_to_line(leaf)
4821
4822         for comment_after in line.comments_after(leaf):
4823             yield from append_to_line(comment_after)
4824
4825     if current_line:
4826         yield current_line
4827
4828
4829 def is_import(leaf: Leaf) -> bool:
4830     """Return True if the given leaf starts an import statement."""
4831     p = leaf.parent
4832     t = leaf.type
4833     v = leaf.value
4834     return bool(
4835         t == token.NAME
4836         and (
4837             (v == "import" and p and p.type == syms.import_name)
4838             or (v == "from" and p and p.type == syms.import_from)
4839         )
4840     )
4841
4842
4843 def is_type_comment(leaf: Leaf, suffix: str = "") -> bool:
4844     """Return True if the given leaf is a special comment.
4845     Only returns true for type comments for now."""
4846     t = leaf.type
4847     v = leaf.value
4848     return t in {token.COMMENT, STANDALONE_COMMENT} and v.startswith("# type:" + suffix)
4849
4850
4851 def normalize_prefix(leaf: Leaf, *, inside_brackets: bool) -> None:
4852     """Leave existing extra newlines if not `inside_brackets`. Remove everything
4853     else.
4854
4855     Note: don't use backslashes for formatting or you'll lose your voting rights.
4856     """
4857     if not inside_brackets:
4858         spl = leaf.prefix.split("#")
4859         if "\\" not in spl[0]:
4860             nl_count = spl[-1].count("\n")
4861             if len(spl) > 1:
4862                 nl_count -= 1
4863             leaf.prefix = "\n" * nl_count
4864             return
4865
4866     leaf.prefix = ""
4867
4868
4869 def normalize_string_prefix(leaf: Leaf, remove_u_prefix: bool = False) -> None:
4870     """Make all string prefixes lowercase.
4871
4872     If remove_u_prefix is given, also removes any u prefix from the string.
4873
4874     Note: Mutates its argument.
4875     """
4876     match = re.match(r"^([" + STRING_PREFIX_CHARS + r"]*)(.*)$", leaf.value, re.DOTALL)
4877     assert match is not None, f"failed to match string {leaf.value!r}"
4878     orig_prefix = match.group(1)
4879     new_prefix = orig_prefix.replace("F", "f").replace("B", "b").replace("U", "u")
4880     if remove_u_prefix:
4881         new_prefix = new_prefix.replace("u", "")
4882     leaf.value = f"{new_prefix}{match.group(2)}"
4883
4884
4885 def normalize_string_quotes(leaf: Leaf) -> None:
4886     """Prefer double quotes but only if it doesn't cause more escaping.
4887
4888     Adds or removes backslashes as appropriate. Doesn't parse and fix
4889     strings nested in f-strings (yet).
4890
4891     Note: Mutates its argument.
4892     """
4893     value = leaf.value.lstrip(STRING_PREFIX_CHARS)
4894     if value[:3] == '"""':
4895         return
4896
4897     elif value[:3] == "'''":
4898         orig_quote = "'''"
4899         new_quote = '"""'
4900     elif value[0] == '"':
4901         orig_quote = '"'
4902         new_quote = "'"
4903     else:
4904         orig_quote = "'"
4905         new_quote = '"'
4906     first_quote_pos = leaf.value.find(orig_quote)
4907     if first_quote_pos == -1:
4908         return  # There's an internal error
4909
4910     prefix = leaf.value[:first_quote_pos]
4911     unescaped_new_quote = re.compile(rf"(([^\\]|^)(\\\\)*){new_quote}")
4912     escaped_new_quote = re.compile(rf"([^\\]|^)\\((?:\\\\)*){new_quote}")
4913     escaped_orig_quote = re.compile(rf"([^\\]|^)\\((?:\\\\)*){orig_quote}")
4914     body = leaf.value[first_quote_pos + len(orig_quote) : -len(orig_quote)]
4915     if "r" in prefix.casefold():
4916         if unescaped_new_quote.search(body):
4917             # There's at least one unescaped new_quote in this raw string
4918             # so converting is impossible
4919             return
4920
4921         # Do not introduce or remove backslashes in raw strings
4922         new_body = body
4923     else:
4924         # remove unnecessary escapes
4925         new_body = sub_twice(escaped_new_quote, rf"\1\2{new_quote}", body)
4926         if body != new_body:
4927             # Consider the string without unnecessary escapes as the original
4928             body = new_body
4929             leaf.value = f"{prefix}{orig_quote}{body}{orig_quote}"
4930         new_body = sub_twice(escaped_orig_quote, rf"\1\2{orig_quote}", new_body)
4931         new_body = sub_twice(unescaped_new_quote, rf"\1\\{new_quote}", new_body)
4932     if "f" in prefix.casefold():
4933         matches = re.findall(
4934             r"""
4935             (?:[^{]|^)\{  # start of the string or a non-{ followed by a single {
4936                 ([^{].*?)  # contents of the brackets except if begins with {{
4937             \}(?:[^}]|$)  # A } followed by end of the string or a non-}
4938             """,
4939             new_body,
4940             re.VERBOSE,
4941         )
4942         for m in matches:
4943             if "\\" in str(m):
4944                 # Do not introduce backslashes in interpolated expressions
4945                 return
4946
4947     if new_quote == '"""' and new_body[-1:] == '"':
4948         # edge case:
4949         new_body = new_body[:-1] + '\\"'
4950     orig_escape_count = body.count("\\")
4951     new_escape_count = new_body.count("\\")
4952     if new_escape_count > orig_escape_count:
4953         return  # Do not introduce more escaping
4954
4955     if new_escape_count == orig_escape_count and orig_quote == '"':
4956         return  # Prefer double quotes
4957
4958     leaf.value = f"{prefix}{new_quote}{new_body}{new_quote}"
4959
4960
4961 def normalize_numeric_literal(leaf: Leaf) -> None:
4962     """Normalizes numeric (float, int, and complex) literals.
4963
4964     All letters used in the representation are normalized to lowercase (except
4965     in Python 2 long literals).
4966     """
4967     text = leaf.value.lower()
4968     if text.startswith(("0o", "0b")):
4969         # Leave octal and binary literals alone.
4970         pass
4971     elif text.startswith("0x"):
4972         # Change hex literals to upper case.
4973         before, after = text[:2], text[2:]
4974         text = f"{before}{after.upper()}"
4975     elif "e" in text:
4976         before, after = text.split("e")
4977         sign = ""
4978         if after.startswith("-"):
4979             after = after[1:]
4980             sign = "-"
4981         elif after.startswith("+"):
4982             after = after[1:]
4983         before = format_float_or_int_string(before)
4984         text = f"{before}e{sign}{after}"
4985     elif text.endswith(("j", "l")):
4986         number = text[:-1]
4987         suffix = text[-1]
4988         # Capitalize in "2L" because "l" looks too similar to "1".
4989         if suffix == "l":
4990             suffix = "L"
4991         text = f"{format_float_or_int_string(number)}{suffix}"
4992     else:
4993         text = format_float_or_int_string(text)
4994     leaf.value = text
4995
4996
4997 def format_float_or_int_string(text: str) -> str:
4998     """Formats a float string like "1.0"."""
4999     if "." not in text:
5000         return text
5001
5002     before, after = text.split(".")
5003     return f"{before or 0}.{after or 0}"
5004
5005
5006 def normalize_invisible_parens(node: Node, parens_after: Set[str]) -> None:
5007     """Make existing optional parentheses invisible or create new ones.
5008
5009     `parens_after` is a set of string leaf values immediately after which parens
5010     should be put.
5011
5012     Standardizes on visible parentheses for single-element tuples, and keeps
5013     existing visible parentheses for other tuples and generator expressions.
5014     """
5015     for pc in list_comments(node.prefix, is_endmarker=False):
5016         if pc.value in FMT_OFF:
5017             # This `node` has a prefix with `# fmt: off`, don't mess with parens.
5018             return
5019     check_lpar = False
5020     for index, child in enumerate(list(node.children)):
5021         # Fixes a bug where invisible parens are not properly stripped from
5022         # assignment statements that contain type annotations.
5023         if isinstance(child, Node) and child.type == syms.annassign:
5024             normalize_invisible_parens(child, parens_after=parens_after)
5025
5026         # Add parentheses around long tuple unpacking in assignments.
5027         if (
5028             index == 0
5029             and isinstance(child, Node)
5030             and child.type == syms.testlist_star_expr
5031         ):
5032             check_lpar = True
5033
5034         if check_lpar:
5035             if is_walrus_assignment(child):
5036                 continue
5037
5038             if child.type == syms.atom:
5039                 if maybe_make_parens_invisible_in_atom(child, parent=node):
5040                     wrap_in_parentheses(node, child, visible=False)
5041             elif is_one_tuple(child):
5042                 wrap_in_parentheses(node, child, visible=True)
5043             elif node.type == syms.import_from:
5044                 # "import from" nodes store parentheses directly as part of
5045                 # the statement
5046                 if child.type == token.LPAR:
5047                     # make parentheses invisible
5048                     child.value = ""  # type: ignore
5049                     node.children[-1].value = ""  # type: ignore
5050                 elif child.type != token.STAR:
5051                     # insert invisible parentheses
5052                     node.insert_child(index, Leaf(token.LPAR, ""))
5053                     node.append_child(Leaf(token.RPAR, ""))
5054                 break
5055
5056             elif not (isinstance(child, Leaf) and is_multiline_string(child)):
5057                 wrap_in_parentheses(node, child, visible=False)
5058
5059         check_lpar = isinstance(child, Leaf) and child.value in parens_after
5060
5061
5062 def normalize_fmt_off(node: Node) -> None:
5063     """Convert content between `# fmt: off`/`# fmt: on` into standalone comments."""
5064     try_again = True
5065     while try_again:
5066         try_again = convert_one_fmt_off_pair(node)
5067
5068
5069 def convert_one_fmt_off_pair(node: Node) -> bool:
5070     """Convert content of a single `# fmt: off`/`# fmt: on` into a standalone comment.
5071
5072     Returns True if a pair was converted.
5073     """
5074     for leaf in node.leaves():
5075         previous_consumed = 0
5076         for comment in list_comments(leaf.prefix, is_endmarker=False):
5077             if comment.value in FMT_OFF:
5078                 # We only want standalone comments. If there's no previous leaf or
5079                 # the previous leaf is indentation, it's a standalone comment in
5080                 # disguise.
5081                 if comment.type != STANDALONE_COMMENT:
5082                     prev = preceding_leaf(leaf)
5083                     if prev and prev.type not in WHITESPACE:
5084                         continue
5085
5086                 ignored_nodes = list(generate_ignored_nodes(leaf))
5087                 if not ignored_nodes:
5088                     continue
5089
5090                 first = ignored_nodes[0]  # Can be a container node with the `leaf`.
5091                 parent = first.parent
5092                 prefix = first.prefix
5093                 first.prefix = prefix[comment.consumed :]
5094                 hidden_value = (
5095                     comment.value + "\n" + "".join(str(n) for n in ignored_nodes)
5096                 )
5097                 if hidden_value.endswith("\n"):
5098                     # That happens when one of the `ignored_nodes` ended with a NEWLINE
5099                     # leaf (possibly followed by a DEDENT).
5100                     hidden_value = hidden_value[:-1]
5101                 first_idx: Optional[int] = None
5102                 for ignored in ignored_nodes:
5103                     index = ignored.remove()
5104                     if first_idx is None:
5105                         first_idx = index
5106                 assert parent is not None, "INTERNAL ERROR: fmt: on/off handling (1)"
5107                 assert first_idx is not None, "INTERNAL ERROR: fmt: on/off handling (2)"
5108                 parent.insert_child(
5109                     first_idx,
5110                     Leaf(
5111                         STANDALONE_COMMENT,
5112                         hidden_value,
5113                         prefix=prefix[:previous_consumed] + "\n" * comment.newlines,
5114                     ),
5115                 )
5116                 return True
5117
5118             previous_consumed = comment.consumed
5119
5120     return False
5121
5122
5123 def generate_ignored_nodes(leaf: Leaf) -> Iterator[LN]:
5124     """Starting from the container of `leaf`, generate all leaves until `# fmt: on`.
5125
5126     Stops at the end of the block.
5127     """
5128     container: Optional[LN] = container_of(leaf)
5129     while container is not None and container.type != token.ENDMARKER:
5130         if fmt_on(container):
5131             return
5132
5133         # fix for fmt: on in children
5134         if contains_fmt_on_at_column(container, leaf.column):
5135             for child in container.children:
5136                 if contains_fmt_on_at_column(child, leaf.column):
5137                     return
5138                 yield child
5139         else:
5140             yield container
5141             container = container.next_sibling
5142
5143
5144 def fmt_on(container: LN) -> bool:
5145     is_fmt_on = False
5146     for comment in list_comments(container.prefix, is_endmarker=False):
5147         if comment.value in FMT_ON:
5148             is_fmt_on = True
5149         elif comment.value in FMT_OFF:
5150             is_fmt_on = False
5151     return is_fmt_on
5152
5153
5154 def contains_fmt_on_at_column(container: LN, column: int) -> bool:
5155     for child in container.children:
5156         if (
5157             isinstance(child, Node)
5158             and first_leaf_column(child) == column
5159             or isinstance(child, Leaf)
5160             and child.column == column
5161         ):
5162             if fmt_on(child):
5163                 return True
5164
5165     return False
5166
5167
5168 def first_leaf_column(node: Node) -> Optional[int]:
5169     for child in node.children:
5170         if isinstance(child, Leaf):
5171             return child.column
5172     return None
5173
5174
5175 def maybe_make_parens_invisible_in_atom(node: LN, parent: LN) -> bool:
5176     """If it's safe, make the parens in the atom `node` invisible, recursively.
5177     Additionally, remove repeated, adjacent invisible parens from the atom `node`
5178     as they are redundant.
5179
5180     Returns whether the node should itself be wrapped in invisible parentheses.
5181
5182     """
5183     if (
5184         node.type != syms.atom
5185         or is_empty_tuple(node)
5186         or is_one_tuple(node)
5187         or (is_yield(node) and parent.type != syms.expr_stmt)
5188         or max_delimiter_priority_in_atom(node) >= COMMA_PRIORITY
5189     ):
5190         return False
5191
5192     first = node.children[0]
5193     last = node.children[-1]
5194     if first.type == token.LPAR and last.type == token.RPAR:
5195         middle = node.children[1]
5196         # make parentheses invisible
5197         first.value = ""  # type: ignore
5198         last.value = ""  # type: ignore
5199         maybe_make_parens_invisible_in_atom(middle, parent=parent)
5200
5201         if is_atom_with_invisible_parens(middle):
5202             # Strip the invisible parens from `middle` by replacing
5203             # it with the child in-between the invisible parens
5204             middle.replace(middle.children[1])
5205
5206         return False
5207
5208     return True
5209
5210
5211 def is_atom_with_invisible_parens(node: LN) -> bool:
5212     """Given a `LN`, determines whether it's an atom `node` with invisible
5213     parens. Useful in dedupe-ing and normalizing parens.
5214     """
5215     if isinstance(node, Leaf) or node.type != syms.atom:
5216         return False
5217
5218     first, last = node.children[0], node.children[-1]
5219     return (
5220         isinstance(first, Leaf)
5221         and first.type == token.LPAR
5222         and first.value == ""
5223         and isinstance(last, Leaf)
5224         and last.type == token.RPAR
5225         and last.value == ""
5226     )
5227
5228
5229 def is_empty_tuple(node: LN) -> bool:
5230     """Return True if `node` holds an empty tuple."""
5231     return (
5232         node.type == syms.atom
5233         and len(node.children) == 2
5234         and node.children[0].type == token.LPAR
5235         and node.children[1].type == token.RPAR
5236     )
5237
5238
5239 def unwrap_singleton_parenthesis(node: LN) -> Optional[LN]:
5240     """Returns `wrapped` if `node` is of the shape ( wrapped ).
5241
5242     Parenthesis can be optional. Returns None otherwise"""
5243     if len(node.children) != 3:
5244         return None
5245
5246     lpar, wrapped, rpar = node.children
5247     if not (lpar.type == token.LPAR and rpar.type == token.RPAR):
5248         return None
5249
5250     return wrapped
5251
5252
5253 def wrap_in_parentheses(parent: Node, child: LN, *, visible: bool = True) -> None:
5254     """Wrap `child` in parentheses.
5255
5256     This replaces `child` with an atom holding the parentheses and the old
5257     child.  That requires moving the prefix.
5258
5259     If `visible` is False, the leaves will be valueless (and thus invisible).
5260     """
5261     lpar = Leaf(token.LPAR, "(" if visible else "")
5262     rpar = Leaf(token.RPAR, ")" if visible else "")
5263     prefix = child.prefix
5264     child.prefix = ""
5265     index = child.remove() or 0
5266     new_child = Node(syms.atom, [lpar, child, rpar])
5267     new_child.prefix = prefix
5268     parent.insert_child(index, new_child)
5269
5270
5271 def is_one_tuple(node: LN) -> bool:
5272     """Return True if `node` holds a tuple with one element, with or without parens."""
5273     if node.type == syms.atom:
5274         gexp = unwrap_singleton_parenthesis(node)
5275         if gexp is None or gexp.type != syms.testlist_gexp:
5276             return False
5277
5278         return len(gexp.children) == 2 and gexp.children[1].type == token.COMMA
5279
5280     return (
5281         node.type in IMPLICIT_TUPLE
5282         and len(node.children) == 2
5283         and node.children[1].type == token.COMMA
5284     )
5285
5286
5287 def is_walrus_assignment(node: LN) -> bool:
5288     """Return True iff `node` is of the shape ( test := test )"""
5289     inner = unwrap_singleton_parenthesis(node)
5290     return inner is not None and inner.type == syms.namedexpr_test
5291
5292
5293 def is_yield(node: LN) -> bool:
5294     """Return True if `node` holds a `yield` or `yield from` expression."""
5295     if node.type == syms.yield_expr:
5296         return True
5297
5298     if node.type == token.NAME and node.value == "yield":  # type: ignore
5299         return True
5300
5301     if node.type != syms.atom:
5302         return False
5303
5304     if len(node.children) != 3:
5305         return False
5306
5307     lpar, expr, rpar = node.children
5308     if lpar.type == token.LPAR and rpar.type == token.RPAR:
5309         return is_yield(expr)
5310
5311     return False
5312
5313
5314 def is_vararg(leaf: Leaf, within: Set[NodeType]) -> bool:
5315     """Return True if `leaf` is a star or double star in a vararg or kwarg.
5316
5317     If `within` includes VARARGS_PARENTS, this applies to function signatures.
5318     If `within` includes UNPACKING_PARENTS, it applies to right hand-side
5319     extended iterable unpacking (PEP 3132) and additional unpacking
5320     generalizations (PEP 448).
5321     """
5322     if leaf.type not in VARARGS_SPECIALS or not leaf.parent:
5323         return False
5324
5325     p = leaf.parent
5326     if p.type == syms.star_expr:
5327         # Star expressions are also used as assignment targets in extended
5328         # iterable unpacking (PEP 3132).  See what its parent is instead.
5329         if not p.parent:
5330             return False
5331
5332         p = p.parent
5333
5334     return p.type in within
5335
5336
5337 def is_multiline_string(leaf: Leaf) -> bool:
5338     """Return True if `leaf` is a multiline string that actually spans many lines."""
5339     return has_triple_quotes(leaf.value) and "\n" in leaf.value
5340
5341
5342 def is_stub_suite(node: Node) -> bool:
5343     """Return True if `node` is a suite with a stub body."""
5344     if (
5345         len(node.children) != 4
5346         or node.children[0].type != token.NEWLINE
5347         or node.children[1].type != token.INDENT
5348         or node.children[3].type != token.DEDENT
5349     ):
5350         return False
5351
5352     return is_stub_body(node.children[2])
5353
5354
5355 def is_stub_body(node: LN) -> bool:
5356     """Return True if `node` is a simple statement containing an ellipsis."""
5357     if not isinstance(node, Node) or node.type != syms.simple_stmt:
5358         return False
5359
5360     if len(node.children) != 2:
5361         return False
5362
5363     child = node.children[0]
5364     return (
5365         child.type == syms.atom
5366         and len(child.children) == 3
5367         and all(leaf == Leaf(token.DOT, ".") for leaf in child.children)
5368     )
5369
5370
5371 def max_delimiter_priority_in_atom(node: LN) -> Priority:
5372     """Return maximum delimiter priority inside `node`.
5373
5374     This is specific to atoms with contents contained in a pair of parentheses.
5375     If `node` isn't an atom or there are no enclosing parentheses, returns 0.
5376     """
5377     if node.type != syms.atom:
5378         return 0
5379
5380     first = node.children[0]
5381     last = node.children[-1]
5382     if not (first.type == token.LPAR and last.type == token.RPAR):
5383         return 0
5384
5385     bt = BracketTracker()
5386     for c in node.children[1:-1]:
5387         if isinstance(c, Leaf):
5388             bt.mark(c)
5389         else:
5390             for leaf in c.leaves():
5391                 bt.mark(leaf)
5392     try:
5393         return bt.max_delimiter_priority()
5394
5395     except ValueError:
5396         return 0
5397
5398
5399 def ensure_visible(leaf: Leaf) -> None:
5400     """Make sure parentheses are visible.
5401
5402     They could be invisible as part of some statements (see
5403     :func:`normalize_invisible_parens` and :func:`visit_import_from`).
5404     """
5405     if leaf.type == token.LPAR:
5406         leaf.value = "("
5407     elif leaf.type == token.RPAR:
5408         leaf.value = ")"
5409
5410
5411 def should_explode(line: Line, opening_bracket: Leaf) -> bool:
5412     """Should `line` immediately be split with `delimiter_split()` after RHS?"""
5413
5414     if not (
5415         opening_bracket.parent
5416         and opening_bracket.parent.type in {syms.atom, syms.import_from}
5417         and opening_bracket.value in "[{("
5418     ):
5419         return False
5420
5421     try:
5422         last_leaf = line.leaves[-1]
5423         exclude = {id(last_leaf)} if last_leaf.type == token.COMMA else set()
5424         max_priority = line.bracket_tracker.max_delimiter_priority(exclude=exclude)
5425     except (IndexError, ValueError):
5426         return False
5427
5428     return max_priority == COMMA_PRIORITY
5429
5430
5431 def get_features_used(node: Node) -> Set[Feature]:
5432     """Return a set of (relatively) new Python features used in this file.
5433
5434     Currently looking for:
5435     - f-strings;
5436     - underscores in numeric literals;
5437     - trailing commas after * or ** in function signatures and calls;
5438     - positional only arguments in function signatures and lambdas;
5439     """
5440     features: Set[Feature] = set()
5441     for n in node.pre_order():
5442         if n.type == token.STRING:
5443             value_head = n.value[:2]  # type: ignore
5444             if value_head in {'f"', 'F"', "f'", "F'", "rf", "fr", "RF", "FR"}:
5445                 features.add(Feature.F_STRINGS)
5446
5447         elif n.type == token.NUMBER:
5448             if "_" in n.value:  # type: ignore
5449                 features.add(Feature.NUMERIC_UNDERSCORES)
5450
5451         elif n.type == token.SLASH:
5452             if n.parent and n.parent.type in {syms.typedargslist, syms.arglist}:
5453                 features.add(Feature.POS_ONLY_ARGUMENTS)
5454
5455         elif n.type == token.COLONEQUAL:
5456             features.add(Feature.ASSIGNMENT_EXPRESSIONS)
5457
5458         elif (
5459             n.type in {syms.typedargslist, syms.arglist}
5460             and n.children
5461             and n.children[-1].type == token.COMMA
5462         ):
5463             if n.type == syms.typedargslist:
5464                 feature = Feature.TRAILING_COMMA_IN_DEF
5465             else:
5466                 feature = Feature.TRAILING_COMMA_IN_CALL
5467
5468             for ch in n.children:
5469                 if ch.type in STARS:
5470                     features.add(feature)
5471
5472                 if ch.type == syms.argument:
5473                     for argch in ch.children:
5474                         if argch.type in STARS:
5475                             features.add(feature)
5476
5477     return features
5478
5479
5480 def detect_target_versions(node: Node) -> Set[TargetVersion]:
5481     """Detect the version to target based on the nodes used."""
5482     features = get_features_used(node)
5483     return {
5484         version for version in TargetVersion if features <= VERSION_TO_FEATURES[version]
5485     }
5486
5487
5488 def generate_trailers_to_omit(line: Line, line_length: int) -> Iterator[Set[LeafID]]:
5489     """Generate sets of closing bracket IDs that should be omitted in a RHS.
5490
5491     Brackets can be omitted if the entire trailer up to and including
5492     a preceding closing bracket fits in one line.
5493
5494     Yielded sets are cumulative (contain results of previous yields, too).  First
5495     set is empty.
5496     """
5497
5498     omit: Set[LeafID] = set()
5499     yield omit
5500
5501     length = 4 * line.depth
5502     opening_bracket: Optional[Leaf] = None
5503     closing_bracket: Optional[Leaf] = None
5504     inner_brackets: Set[LeafID] = set()
5505     for index, leaf, leaf_length in enumerate_with_length(line, reversed=True):
5506         length += leaf_length
5507         if length > line_length:
5508             break
5509
5510         has_inline_comment = leaf_length > len(leaf.value) + len(leaf.prefix)
5511         if leaf.type == STANDALONE_COMMENT or has_inline_comment:
5512             break
5513
5514         if opening_bracket:
5515             if leaf is opening_bracket:
5516                 opening_bracket = None
5517             elif leaf.type in CLOSING_BRACKETS:
5518                 inner_brackets.add(id(leaf))
5519         elif leaf.type in CLOSING_BRACKETS:
5520             if index > 0 and line.leaves[index - 1].type in OPENING_BRACKETS:
5521                 # Empty brackets would fail a split so treat them as "inner"
5522                 # brackets (e.g. only add them to the `omit` set if another
5523                 # pair of brackets was good enough.
5524                 inner_brackets.add(id(leaf))
5525                 continue
5526
5527             if closing_bracket:
5528                 omit.add(id(closing_bracket))
5529                 omit.update(inner_brackets)
5530                 inner_brackets.clear()
5531                 yield omit
5532
5533             if leaf.value:
5534                 opening_bracket = leaf.opening_bracket
5535                 closing_bracket = leaf
5536
5537
5538 def get_future_imports(node: Node) -> Set[str]:
5539     """Return a set of __future__ imports in the file."""
5540     imports: Set[str] = set()
5541
5542     def get_imports_from_children(children: List[LN]) -> Generator[str, None, None]:
5543         for child in children:
5544             if isinstance(child, Leaf):
5545                 if child.type == token.NAME:
5546                     yield child.value
5547
5548             elif child.type == syms.import_as_name:
5549                 orig_name = child.children[0]
5550                 assert isinstance(orig_name, Leaf), "Invalid syntax parsing imports"
5551                 assert orig_name.type == token.NAME, "Invalid syntax parsing imports"
5552                 yield orig_name.value
5553
5554             elif child.type == syms.import_as_names:
5555                 yield from get_imports_from_children(child.children)
5556
5557             else:
5558                 raise AssertionError("Invalid syntax parsing imports")
5559
5560     for child in node.children:
5561         if child.type != syms.simple_stmt:
5562             break
5563
5564         first_child = child.children[0]
5565         if isinstance(first_child, Leaf):
5566             # Continue looking if we see a docstring; otherwise stop.
5567             if (
5568                 len(child.children) == 2
5569                 and first_child.type == token.STRING
5570                 and child.children[1].type == token.NEWLINE
5571             ):
5572                 continue
5573
5574             break
5575
5576         elif first_child.type == syms.import_from:
5577             module_name = first_child.children[1]
5578             if not isinstance(module_name, Leaf) or module_name.value != "__future__":
5579                 break
5580
5581             imports |= set(get_imports_from_children(first_child.children[3:]))
5582         else:
5583             break
5584
5585     return imports
5586
5587
5588 @lru_cache()
5589 def get_gitignore(root: Path) -> PathSpec:
5590     """ Return a PathSpec matching gitignore content if present."""
5591     gitignore = root / ".gitignore"
5592     lines: List[str] = []
5593     if gitignore.is_file():
5594         with gitignore.open() as gf:
5595             lines = gf.readlines()
5596     return PathSpec.from_lines("gitwildmatch", lines)
5597
5598
5599 def gen_python_files_in_dir(
5600     path: Path,
5601     root: Path,
5602     include: Pattern[str],
5603     exclude: Pattern[str],
5604     report: "Report",
5605     gitignore: PathSpec,
5606 ) -> Iterator[Path]:
5607     """Generate all files under `path` whose paths are not excluded by the
5608     `exclude` regex, but are included by the `include` regex.
5609
5610     Symbolic links pointing outside of the `root` directory are ignored.
5611
5612     `report` is where output about exclusions goes.
5613     """
5614     assert root.is_absolute(), f"INTERNAL ERROR: `root` must be absolute but is {root}"
5615     for child in path.iterdir():
5616         # First ignore files matching .gitignore
5617         if gitignore.match_file(child.as_posix()):
5618             report.path_ignored(child, "matches the .gitignore file content")
5619             continue
5620
5621         # Then ignore with `exclude` option.
5622         try:
5623             normalized_path = "/" + child.resolve().relative_to(root).as_posix()
5624         except OSError as e:
5625             report.path_ignored(child, f"cannot be read because {e}")
5626             continue
5627
5628         except ValueError:
5629             if child.is_symlink():
5630                 report.path_ignored(
5631                     child, f"is a symbolic link that points outside {root}"
5632                 )
5633                 continue
5634
5635             raise
5636
5637         if child.is_dir():
5638             normalized_path += "/"
5639
5640         exclude_match = exclude.search(normalized_path)
5641         if exclude_match and exclude_match.group(0):
5642             report.path_ignored(child, "matches the --exclude regular expression")
5643             continue
5644
5645         if child.is_dir():
5646             yield from gen_python_files_in_dir(
5647                 child, root, include, exclude, report, gitignore
5648             )
5649
5650         elif child.is_file():
5651             include_match = include.search(normalized_path)
5652             if include_match:
5653                 yield child
5654
5655
5656 @lru_cache()
5657 def find_project_root(srcs: Iterable[str]) -> Path:
5658     """Return a directory containing .git, .hg, or pyproject.toml.
5659
5660     That directory can be one of the directories passed in `srcs` or their
5661     common parent.
5662
5663     If no directory in the tree contains a marker that would specify it's the
5664     project root, the root of the file system is returned.
5665     """
5666     if not srcs:
5667         return Path("/").resolve()
5668
5669     common_base = min(Path(src).resolve() for src in srcs)
5670     if common_base.is_dir():
5671         # Append a fake file so `parents` below returns `common_base_dir`, too.
5672         common_base /= "fake-file"
5673     for directory in common_base.parents:
5674         if (directory / ".git").exists():
5675             return directory
5676
5677         if (directory / ".hg").is_dir():
5678             return directory
5679
5680         if (directory / "pyproject.toml").is_file():
5681             return directory
5682
5683     return directory
5684
5685
5686 @dataclass
5687 class Report:
5688     """Provides a reformatting counter. Can be rendered with `str(report)`."""
5689
5690     check: bool = False
5691     diff: bool = False
5692     quiet: bool = False
5693     verbose: bool = False
5694     change_count: int = 0
5695     same_count: int = 0
5696     failure_count: int = 0
5697
5698     def done(self, src: Path, changed: Changed) -> None:
5699         """Increment the counter for successful reformatting. Write out a message."""
5700         if changed is Changed.YES:
5701             reformatted = "would reformat" if self.check or self.diff else "reformatted"
5702             if self.verbose or not self.quiet:
5703                 out(f"{reformatted} {src}")
5704             self.change_count += 1
5705         else:
5706             if self.verbose:
5707                 if changed is Changed.NO:
5708                     msg = f"{src} already well formatted, good job."
5709                 else:
5710                     msg = f"{src} wasn't modified on disk since last run."
5711                 out(msg, bold=False)
5712             self.same_count += 1
5713
5714     def failed(self, src: Path, message: str) -> None:
5715         """Increment the counter for failed reformatting. Write out a message."""
5716         err(f"error: cannot format {src}: {message}")
5717         self.failure_count += 1
5718
5719     def path_ignored(self, path: Path, message: str) -> None:
5720         if self.verbose:
5721             out(f"{path} ignored: {message}", bold=False)
5722
5723     @property
5724     def return_code(self) -> int:
5725         """Return the exit code that the app should use.
5726
5727         This considers the current state of changed files and failures:
5728         - if there were any failures, return 123;
5729         - if any files were changed and --check is being used, return 1;
5730         - otherwise return 0.
5731         """
5732         # According to http://tldp.org/LDP/abs/html/exitcodes.html starting with
5733         # 126 we have special return codes reserved by the shell.
5734         if self.failure_count:
5735             return 123
5736
5737         elif self.change_count and self.check:
5738             return 1
5739
5740         return 0
5741
5742     def __str__(self) -> str:
5743         """Render a color report of the current state.
5744
5745         Use `click.unstyle` to remove colors.
5746         """
5747         if self.check or self.diff:
5748             reformatted = "would be reformatted"
5749             unchanged = "would be left unchanged"
5750             failed = "would fail to reformat"
5751         else:
5752             reformatted = "reformatted"
5753             unchanged = "left unchanged"
5754             failed = "failed to reformat"
5755         report = []
5756         if self.change_count:
5757             s = "s" if self.change_count > 1 else ""
5758             report.append(
5759                 click.style(f"{self.change_count} file{s} {reformatted}", bold=True)
5760             )
5761         if self.same_count:
5762             s = "s" if self.same_count > 1 else ""
5763             report.append(f"{self.same_count} file{s} {unchanged}")
5764         if self.failure_count:
5765             s = "s" if self.failure_count > 1 else ""
5766             report.append(
5767                 click.style(f"{self.failure_count} file{s} {failed}", fg="red")
5768             )
5769         return ", ".join(report) + "."
5770
5771
5772 def parse_ast(src: str) -> Union[ast.AST, ast3.AST, ast27.AST]:
5773     filename = "<unknown>"
5774     if sys.version_info >= (3, 8):
5775         # TODO: support Python 4+ ;)
5776         for minor_version in range(sys.version_info[1], 4, -1):
5777             try:
5778                 return ast.parse(src, filename, feature_version=(3, minor_version))
5779             except SyntaxError:
5780                 continue
5781     else:
5782         for feature_version in (7, 6):
5783             try:
5784                 return ast3.parse(src, filename, feature_version=feature_version)
5785             except SyntaxError:
5786                 continue
5787
5788     return ast27.parse(src)
5789
5790
5791 def _fixup_ast_constants(
5792     node: Union[ast.AST, ast3.AST, ast27.AST]
5793 ) -> Union[ast.AST, ast3.AST, ast27.AST]:
5794     """Map ast nodes deprecated in 3.8 to Constant."""
5795     if isinstance(node, (ast.Str, ast3.Str, ast27.Str, ast.Bytes, ast3.Bytes)):
5796         return ast.Constant(value=node.s)
5797
5798     if isinstance(node, (ast.Num, ast3.Num, ast27.Num)):
5799         return ast.Constant(value=node.n)
5800
5801     if isinstance(node, (ast.NameConstant, ast3.NameConstant)):
5802         return ast.Constant(value=node.value)
5803
5804     return node
5805
5806
5807 def assert_equivalent(src: str, dst: str) -> None:
5808     """Raise AssertionError if `src` and `dst` aren't equivalent."""
5809
5810     def _v(node: Union[ast.AST, ast3.AST, ast27.AST], depth: int = 0) -> Iterator[str]:
5811         """Simple visitor generating strings to compare ASTs by content."""
5812
5813         node = _fixup_ast_constants(node)
5814
5815         yield f"{'  ' * depth}{node.__class__.__name__}("
5816
5817         for field in sorted(node._fields):  # noqa: F402
5818             # TypeIgnore has only one field 'lineno' which breaks this comparison
5819             type_ignore_classes = (ast3.TypeIgnore, ast27.TypeIgnore)
5820             if sys.version_info >= (3, 8):
5821                 type_ignore_classes += (ast.TypeIgnore,)
5822             if isinstance(node, type_ignore_classes):
5823                 break
5824
5825             try:
5826                 value = getattr(node, field)
5827             except AttributeError:
5828                 continue
5829
5830             yield f"{'  ' * (depth+1)}{field}="
5831
5832             if isinstance(value, list):
5833                 for item in value:
5834                     # Ignore nested tuples within del statements, because we may insert
5835                     # parentheses and they change the AST.
5836                     if (
5837                         field == "targets"
5838                         and isinstance(node, (ast.Delete, ast3.Delete, ast27.Delete))
5839                         and isinstance(item, (ast.Tuple, ast3.Tuple, ast27.Tuple))
5840                     ):
5841                         for item in item.elts:
5842                             yield from _v(item, depth + 2)
5843
5844                     elif isinstance(item, (ast.AST, ast3.AST, ast27.AST)):
5845                         yield from _v(item, depth + 2)
5846
5847             elif isinstance(value, (ast.AST, ast3.AST, ast27.AST)):
5848                 yield from _v(value, depth + 2)
5849
5850             else:
5851                 yield f"{'  ' * (depth+2)}{value!r},  # {value.__class__.__name__}"
5852
5853         yield f"{'  ' * depth})  # /{node.__class__.__name__}"
5854
5855     try:
5856         src_ast = parse_ast(src)
5857     except Exception as exc:
5858         raise AssertionError(
5859             "cannot use --safe with this file; failed to parse source file.  AST"
5860             f" error message: {exc}"
5861         )
5862
5863     try:
5864         dst_ast = parse_ast(dst)
5865     except Exception as exc:
5866         log = dump_to_file("".join(traceback.format_tb(exc.__traceback__)), dst)
5867         raise AssertionError(
5868             f"INTERNAL ERROR: Black produced invalid code: {exc}. Please report a bug"
5869             " on https://github.com/psf/black/issues.  This invalid output might be"
5870             f" helpful: {log}"
5871         ) from None
5872
5873     src_ast_str = "\n".join(_v(src_ast))
5874     dst_ast_str = "\n".join(_v(dst_ast))
5875     if src_ast_str != dst_ast_str:
5876         log = dump_to_file(diff(src_ast_str, dst_ast_str, "src", "dst"))
5877         raise AssertionError(
5878             "INTERNAL ERROR: Black produced code that is not equivalent to the"
5879             " source.  Please report a bug on https://github.com/psf/black/issues. "
5880             f" This diff might be helpful: {log}"
5881         ) from None
5882
5883
5884 def assert_stable(src: str, dst: str, mode: Mode) -> None:
5885     """Raise AssertionError if `dst` reformats differently the second time."""
5886     newdst = format_str(dst, mode=mode)
5887     if dst != newdst:
5888         log = dump_to_file(
5889             diff(src, dst, "source", "first pass"),
5890             diff(dst, newdst, "first pass", "second pass"),
5891         )
5892         raise AssertionError(
5893             "INTERNAL ERROR: Black produced different code on the second pass of the"
5894             " formatter.  Please report a bug on https://github.com/psf/black/issues."
5895             f"  This diff might be helpful: {log}"
5896         ) from None
5897
5898
5899 @mypyc_attr(patchable=True)
5900 def dump_to_file(*output: str) -> str:
5901     """Dump `output` to a temporary file. Return path to the file."""
5902     with tempfile.NamedTemporaryFile(
5903         mode="w", prefix="blk_", suffix=".log", delete=False, encoding="utf8"
5904     ) as f:
5905         for lines in output:
5906             f.write(lines)
5907             if lines and lines[-1] != "\n":
5908                 f.write("\n")
5909     return f.name
5910
5911
5912 @contextmanager
5913 def nullcontext() -> Iterator[None]:
5914     """Return an empty context manager.
5915
5916     To be used like `nullcontext` in Python 3.7.
5917     """
5918     yield
5919
5920
5921 def diff(a: str, b: str, a_name: str, b_name: str) -> str:
5922     """Return a unified diff string between strings `a` and `b`."""
5923     import difflib
5924
5925     a_lines = [line + "\n" for line in a.splitlines()]
5926     b_lines = [line + "\n" for line in b.splitlines()]
5927     return "".join(
5928         difflib.unified_diff(a_lines, b_lines, fromfile=a_name, tofile=b_name, n=5)
5929     )
5930
5931
5932 def cancel(tasks: Iterable["asyncio.Task[Any]"]) -> None:
5933     """asyncio signal handler that cancels all `tasks` and reports to stderr."""
5934     err("Aborted!")
5935     for task in tasks:
5936         task.cancel()
5937
5938
5939 def shutdown(loop: asyncio.AbstractEventLoop) -> None:
5940     """Cancel all pending tasks on `loop`, wait for them, and close the loop."""
5941     try:
5942         if sys.version_info[:2] >= (3, 7):
5943             all_tasks = asyncio.all_tasks
5944         else:
5945             all_tasks = asyncio.Task.all_tasks
5946         # This part is borrowed from asyncio/runners.py in Python 3.7b2.
5947         to_cancel = [task for task in all_tasks(loop) if not task.done()]
5948         if not to_cancel:
5949             return
5950
5951         for task in to_cancel:
5952             task.cancel()
5953         loop.run_until_complete(
5954             asyncio.gather(*to_cancel, loop=loop, return_exceptions=True)
5955         )
5956     finally:
5957         # `concurrent.futures.Future` objects cannot be cancelled once they
5958         # are already running. There might be some when the `shutdown()` happened.
5959         # Silence their logger's spew about the event loop being closed.
5960         cf_logger = logging.getLogger("concurrent.futures")
5961         cf_logger.setLevel(logging.CRITICAL)
5962         loop.close()
5963
5964
5965 def sub_twice(regex: Pattern[str], replacement: str, original: str) -> str:
5966     """Replace `regex` with `replacement` twice on `original`.
5967
5968     This is used by string normalization to perform replaces on
5969     overlapping matches.
5970     """
5971     return regex.sub(replacement, regex.sub(replacement, original))
5972
5973
5974 def re_compile_maybe_verbose(regex: str) -> Pattern[str]:
5975     """Compile a regular expression string in `regex`.
5976
5977     If it contains newlines, use verbose mode.
5978     """
5979     if "\n" in regex:
5980         regex = "(?x)" + regex
5981     compiled: Pattern[str] = re.compile(regex)
5982     return compiled
5983
5984
5985 def enumerate_reversed(sequence: Sequence[T]) -> Iterator[Tuple[Index, T]]:
5986     """Like `reversed(enumerate(sequence))` if that were possible."""
5987     index = len(sequence) - 1
5988     for element in reversed(sequence):
5989         yield (index, element)
5990         index -= 1
5991
5992
5993 def enumerate_with_length(
5994     line: Line, reversed: bool = False
5995 ) -> Iterator[Tuple[Index, Leaf, int]]:
5996     """Return an enumeration of leaves with their length.
5997
5998     Stops prematurely on multiline strings and standalone comments.
5999     """
6000     op = cast(
6001         Callable[[Sequence[Leaf]], Iterator[Tuple[Index, Leaf]]],
6002         enumerate_reversed if reversed else enumerate,
6003     )
6004     for index, leaf in op(line.leaves):
6005         length = len(leaf.prefix) + len(leaf.value)
6006         if "\n" in leaf.value:
6007             return  # Multiline strings, we can't continue.
6008
6009         for comment in line.comments_after(leaf):
6010             length += len(comment.value)
6011
6012         yield index, leaf, length
6013
6014
6015 def is_line_short_enough(line: Line, *, line_length: int, line_str: str = "") -> bool:
6016     """Return True if `line` is no longer than `line_length`.
6017
6018     Uses the provided `line_str` rendering, if any, otherwise computes a new one.
6019     """
6020     if not line_str:
6021         line_str = line_to_string(line)
6022     return (
6023         len(line_str) <= line_length
6024         and "\n" not in line_str  # multiline strings
6025         and not line.contains_standalone_comments()
6026     )
6027
6028
6029 def can_be_split(line: Line) -> bool:
6030     """Return False if the line cannot be split *for sure*.
6031
6032     This is not an exhaustive search but a cheap heuristic that we can use to
6033     avoid some unfortunate formattings (mostly around wrapping unsplittable code
6034     in unnecessary parentheses).
6035     """
6036     leaves = line.leaves
6037     if len(leaves) < 2:
6038         return False
6039
6040     if leaves[0].type == token.STRING and leaves[1].type == token.DOT:
6041         call_count = 0
6042         dot_count = 0
6043         next = leaves[-1]
6044         for leaf in leaves[-2::-1]:
6045             if leaf.type in OPENING_BRACKETS:
6046                 if next.type not in CLOSING_BRACKETS:
6047                     return False
6048
6049                 call_count += 1
6050             elif leaf.type == token.DOT:
6051                 dot_count += 1
6052             elif leaf.type == token.NAME:
6053                 if not (next.type == token.DOT or next.type in OPENING_BRACKETS):
6054                     return False
6055
6056             elif leaf.type not in CLOSING_BRACKETS:
6057                 return False
6058
6059             if dot_count > 1 and call_count > 1:
6060                 return False
6061
6062     return True
6063
6064
6065 def can_omit_invisible_parens(line: Line, line_length: int) -> bool:
6066     """Does `line` have a shape safe to reformat without optional parens around it?
6067
6068     Returns True for only a subset of potentially nice looking formattings but
6069     the point is to not return false positives that end up producing lines that
6070     are too long.
6071     """
6072     bt = line.bracket_tracker
6073     if not bt.delimiters:
6074         # Without delimiters the optional parentheses are useless.
6075         return True
6076
6077     max_priority = bt.max_delimiter_priority()
6078     if bt.delimiter_count_with_priority(max_priority) > 1:
6079         # With more than one delimiter of a kind the optional parentheses read better.
6080         return False
6081
6082     if max_priority == DOT_PRIORITY:
6083         # A single stranded method call doesn't require optional parentheses.
6084         return True
6085
6086     assert len(line.leaves) >= 2, "Stranded delimiter"
6087
6088     first = line.leaves[0]
6089     second = line.leaves[1]
6090     penultimate = line.leaves[-2]
6091     last = line.leaves[-1]
6092
6093     # With a single delimiter, omit if the expression starts or ends with
6094     # a bracket.
6095     if first.type in OPENING_BRACKETS and second.type not in CLOSING_BRACKETS:
6096         remainder = False
6097         length = 4 * line.depth
6098         for _index, leaf, leaf_length in enumerate_with_length(line):
6099             if leaf.type in CLOSING_BRACKETS and leaf.opening_bracket is first:
6100                 remainder = True
6101             if remainder:
6102                 length += leaf_length
6103                 if length > line_length:
6104                     break
6105
6106                 if leaf.type in OPENING_BRACKETS:
6107                     # There are brackets we can further split on.
6108                     remainder = False
6109
6110         else:
6111             # checked the entire string and line length wasn't exceeded
6112             if len(line.leaves) == _index + 1:
6113                 return True
6114
6115         # Note: we are not returning False here because a line might have *both*
6116         # a leading opening bracket and a trailing closing bracket.  If the
6117         # opening bracket doesn't match our rule, maybe the closing will.
6118
6119     if (
6120         last.type == token.RPAR
6121         or last.type == token.RBRACE
6122         or (
6123             # don't use indexing for omitting optional parentheses;
6124             # it looks weird
6125             last.type == token.RSQB
6126             and last.parent
6127             and last.parent.type != syms.trailer
6128         )
6129     ):
6130         if penultimate.type in OPENING_BRACKETS:
6131             # Empty brackets don't help.
6132             return False
6133
6134         if is_multiline_string(first):
6135             # Additional wrapping of a multiline string in this situation is
6136             # unnecessary.
6137             return True
6138
6139         length = 4 * line.depth
6140         seen_other_brackets = False
6141         for _index, leaf, leaf_length in enumerate_with_length(line):
6142             length += leaf_length
6143             if leaf is last.opening_bracket:
6144                 if seen_other_brackets or length <= line_length:
6145                     return True
6146
6147             elif leaf.type in OPENING_BRACKETS:
6148                 # There are brackets we can further split on.
6149                 seen_other_brackets = True
6150
6151     return False
6152
6153
6154 def get_cache_file(mode: Mode) -> Path:
6155     return CACHE_DIR / f"cache.{mode.get_cache_key()}.pickle"
6156
6157
6158 def read_cache(mode: Mode) -> Cache:
6159     """Read the cache if it exists and is well formed.
6160
6161     If it is not well formed, the call to write_cache later should resolve the issue.
6162     """
6163     cache_file = get_cache_file(mode)
6164     if not cache_file.exists():
6165         return {}
6166
6167     with cache_file.open("rb") as fobj:
6168         try:
6169             cache: Cache = pickle.load(fobj)
6170         except (pickle.UnpicklingError, ValueError):
6171             return {}
6172
6173     return cache
6174
6175
6176 def get_cache_info(path: Path) -> CacheInfo:
6177     """Return the information used to check if a file is already formatted or not."""
6178     stat = path.stat()
6179     return stat.st_mtime, stat.st_size
6180
6181
6182 def filter_cached(cache: Cache, sources: Iterable[Path]) -> Tuple[Set[Path], Set[Path]]:
6183     """Split an iterable of paths in `sources` into two sets.
6184
6185     The first contains paths of files that modified on disk or are not in the
6186     cache. The other contains paths to non-modified files.
6187     """
6188     todo, done = set(), set()
6189     for src in sources:
6190         src = src.resolve()
6191         if cache.get(src) != get_cache_info(src):
6192             todo.add(src)
6193         else:
6194             done.add(src)
6195     return todo, done
6196
6197
6198 def write_cache(cache: Cache, sources: Iterable[Path], mode: Mode) -> None:
6199     """Update the cache file."""
6200     cache_file = get_cache_file(mode)
6201     try:
6202         CACHE_DIR.mkdir(parents=True, exist_ok=True)
6203         new_cache = {**cache, **{src.resolve(): get_cache_info(src) for src in sources}}
6204         with tempfile.NamedTemporaryFile(dir=str(cache_file.parent), delete=False) as f:
6205             pickle.dump(new_cache, f, protocol=4)
6206         os.replace(f.name, cache_file)
6207     except OSError:
6208         pass
6209
6210
6211 def patch_click() -> None:
6212     """Make Click not crash.
6213
6214     On certain misconfigured environments, Python 3 selects the ASCII encoding as the
6215     default which restricts paths that it can access during the lifetime of the
6216     application.  Click refuses to work in this scenario by raising a RuntimeError.
6217
6218     In case of Black the likelihood that non-ASCII characters are going to be used in
6219     file paths is minimal since it's Python source code.  Moreover, this crash was
6220     spurious on Python 3.7 thanks to PEP 538 and PEP 540.
6221     """
6222     try:
6223         from click import core
6224         from click import _unicodefun  # type: ignore
6225     except ModuleNotFoundError:
6226         return
6227
6228     for module in (core, _unicodefun):
6229         if hasattr(module, "_verify_python3_env"):
6230             module._verify_python3_env = lambda: None
6231
6232
6233 def patched_main() -> None:
6234     freeze_support()
6235     patch_click()
6236     main()
6237
6238
6239 if __name__ == "__main__":
6240     patched_main()