Hướng dẫn pairwise2 biopython - pairwise2 biopython

Biopython

Căn chỉnh trình tự theo cặp bằng thuật toán lập trình động.

Điều này cung cấp các chức năng để có được sự sắp xếp toàn cầu và địa phương giữa hai chuỗi. Một sự liên kết toàn cầu tìm thấy sự phù hợp tốt nhất giữa tất cả các ký tự trong hai chuỗi. Một căn chỉnh địa phương chỉ tìm thấy các chuỗi đôi phù hợp nhất. Căn chỉnh địa phương phải có điểm số dương để được báo cáo và chúng sẽ không được mở rộng cho các trận đấu đếm bằng 0. Điều này có nghĩa là một căn chỉnh cục bộ sẽ luôn bắt đầu và kết thúc với một trận đấu đếm tích cực.

Khi thực hiện căn chỉnh, bạn có thể chỉ định điểm số trận đấu và hình phạt khoảng cách. Điểm trận đấu cho thấy khả năng tương thích giữa sự liên kết của hai ký tự trong chuỗi. Các ký tự tương thích cao nên được ghi điểm tích cực và các ký tự không tương thích nên được ghi điểm âm hoặc 0. Các hình phạt khoảng cách nên âm.

Tên của các chức năng căn chỉnh trong mô -đun này theo quy ước XX trong đó là toàn cầu trên toàn cầu hoặc địa phương và XX là mã 2 ký tự cho biết các tham số cần thiết. Ký tự đầu tiên chỉ ra các tham số cho các trận đấu (và không phù hợp) và thứ hai chỉ ra các tham số cho các hình phạt khoảng cách.

Các tham số khớp là:

CODE  DESCRIPTION
x     No parameters. Identical characters have score of 1, otherwise 0.
m     A match score is the score of identical chars, otherwise mismatch
      score.
d     A dictionary returns the score of any pair of characters.
c     A callback function returns scores.

Các tham số hình phạt khoảng cách là:

CODE  DESCRIPTION
x     No gap penalties.
s     Same open and extend gap penalties for both sequences.
d     The sequences have different open and extend gap penalties.
c     A callback function returns the gap penalties.

Tất cả các hàm căn chỉnh khác nhau được chứa trong một đối tượng

CODE  DESCRIPTION
x     No gap penalties.
s     Same open and extend gap penalties for both sequences.
d     The sequences have different open and extend gap penalties.
c     A callback function returns the gap penalties.
2. Ví dụ:

>>> from Bio import pairwise2
>>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")

sẽ trả lại một danh sách các sự sắp xếp giữa hai chuỗi. Để có bản in đẹp, hãy sử dụng phương thức

CODE  DESCRIPTION
x     No gap penalties.
s     Same open and extend gap penalties for both sequences.
d     The sequences have different open and extend gap penalties.
c     A callback function returns the gap penalties.
3 của mô -đun:

>>> from Bio.pairwise2 import format_alignment
>>> print(format_alignment(*alignments[0]))
ACCGT
| || 
A-CG-
  Score=3

Tất cả các chức năng căn chỉnh đều có các đối số sau:

  • Hai chuỗi: chuỗi, các đối tượng hoặc danh sách trình tự Biopython. Danh sách rất hữu ích để cung cấp các chuỗi có chứa dư lượng được mã hóa bởi nhiều chữ cái.

  • CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    4: Boolean (Mặc định: Sai). Có tính một hình phạt mở rộng khi mở một khoảng trống. Nếu sai, khoảng cách 1 chỉ bị phạt một hình phạt mở của người Hồi giáo, nếu không thì nó bị phạt mở+mở rộng.

  • CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    5: Boolean. Có đếm các khoảng trống ở cuối của một căn chỉnh. Theo mặc định, chúng được tính cho sự sắp xếp toàn cầu nhưng không dành cho địa phương. Cài đặt
    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    5 thành (Boolean, Boolean) cho phép bạn chỉ định riêng cho hai chuỗi liệu có nên tính các khoảng trống ở cuối căn chỉnh hay không.

  • CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    7: Chuỗi (mặc định:
    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    8). Ký tự nào sử dụng làm ký tự khoảng cách trong căn chỉnh được trả về. Nếu trình tự đầu vào của bạn là danh sách, bạn phải thay đổi điều này thành
    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    9.

  • >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    0: Boolean (Mặc định: Sai). Luôn luôn sử dụng chức năng lập trình chung, không lưu nhất, (chậm!). Để gỡ lỗi.

  • >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    1: Boolean (Mặc định: Sai). Chỉ có được điểm số tốt nhất, don lồng phục hồi bất kỳ sự sắp xếp nào. Giá trị trả về của hàm là điểm số. Nhanh hơn và sử dụng ít bộ nhớ hơn.

  • >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    2: Boolean (Mặc định: Sai). Chỉ phục hồi một liên kết.

Các tham số khác của hàm căn chỉnh phụ thuộc vào hàm được gọi. Vài ví dụ:

  • Tìm sự liên kết toàn cầu tốt nhất giữa hai chuỗi. Các ký tự giống hệt nhau được đưa ra 1 điểm. Không có điểm nào được khấu trừ cho sự không phù hợp hoặc khoảng trống.

    >>> for a in pairwise2.align.globalxx("ACCGT", "ACG"):
    ...     print(format_alignment(*a))
    ACCGT
    | || 
    A-CG-
      Score=3
    
    ACCGT
    || | 
    AC-G-
      Score=3
    

  • Điều tương tự như trước đây, nhưng với một sự liên kết địa phương. Lưu ý rằng

    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    3 sẽ chỉ hiển thị các phần được căn chỉnh của các chuỗi, cùng với các vị trí bắt đầu.

    >>> for a in pairwise2.align.localxx("ACCGT", "ACG"):
    ...     print(format_alignment(*a))
    1 ACCG
      | ||
    1 A-CG
      Score=3
    
    1 ACCG
      || |
    1 AC-G
      Score=3
    

    Để khôi phục hành vi ’lịch sử của

    >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    4, tức là cũng hiển thị các phần không liên kết của cả hai chuỗi, hãy sử dụng tham số từ khóa mới
    >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    5:

    >>> for a in pairwise2.align.localxx("ACCGT", "ACG"):
    ...     print(format_alignment(*a, full_sequences=True))
    ACCGT
    | || 
    A-CG-
      Score=3
    
    ACCGT
    || | 
    AC-G-
      Score=3
    

  • Làm một sự liên kết toàn cầu. Các ký tự giống hệt nhau được cho 2 điểm, 1 điểm được khấu trừ cho mỗi ký tự không giống nhau. Don lồng phạt các khoảng trống.

    >>> for a in pairwise2.align.globalmx("ACCGT", "ACG", 2, -1):
    ...     print(format_alignment(*a))
    ACCGT
    | || 
    A-CG-
      Score=6
    
    ACCGT
    || | 
    AC-G-
      Score=6
    

  • Tương tự như trên, ngoại trừ bây giờ 0,5 điểm được khấu trừ khi mở một khoảng cách và 0,1 điểm được khấu trừ khi mở rộng nó.

    >>> for a in pairwise2.align.globalms("ACCGT", "ACG", 2, -1, -.5, -.1):
    ...     print(format_alignment(*a))
    ACCGT
    | || 
    A-CG-
      Score=5
    
    ACCGT
    || | 
    AC-G-
      Score=5
    

  • Tùy thuộc vào hình phạt, một khoảng cách theo một chuỗi có thể được theo sau bởi một khoảng cách trong chuỗi khác. Nếu bạn không thích hành vi này, hãy tăng hình phạt mở khoảng cách:

    >>> for a in pairwise2.align.globalms("A", "T", 5, -4, -1, -.1):
    ...     print(format_alignment(*a))
    A-
    
    -T
      Score=-2
    
    >>> for a in pairwise2.align.globalms("A", "T", 5, -4, -3, -.1):
    ...     print(format_alignment(*a))
    A
    .
    T
      Score=-4
    

  • Hàm căn chỉnh cũng có thể sử dụng các ma trận đã biết đã được bao gồm trong Biopython (

    >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    6 từ
    >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    7):

    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    0

  • Với tham số

    >>> from Bio import pairwise2
    >>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
    
    8, bạn có thể xác định các hàm khớp và khoảng cách của riêng bạn. Ví dụ. Để xác định hàm khoảng cách logarit affine và sử dụng nó:

    CODE  DESCRIPTION
    x     No gap penalties.
    s     Same open and extend gap penalties for both sequences.
    d     The sequences have different open and extend gap penalties.
    c     A callback function returns the gap penalties.
    
    1

    Bạn có thể xác định các hàm khoảng cách khác nhau cho mỗi chuỗi. Các chức năng đối sánh tự xác định phải lấy hai dư lượng để được so sánh và trả về điểm số.

Để xem mô tả về các tham số cho một hàm, vui lòng xem tài liệu cho hàm thông qua hàm trợ giúp, ví dụ: Loại

>>> from Bio import pairwise2
>>> alignments = pairwise2.align.globalxx("ACCGT", "ACG")
9 tại dấu nhắc Python.

Lớp ________ 30 ________ 31 (khớp = 1, không phù hợp = 0) ¶(match=1, mismatch=0)

Cơ sở:

>>> from Bio.pairwise2 import format_alignment
>>> print(format_alignment(*alignments[0]))
ACCGT
| || 
A-CG-
  Score=3
2

Tạo một hàm khớp để sử dụng trong một căn chỉnh.

Trận đấu và không phù hợp là điểm số để cung cấp khi hai dư lượng bằng hoặc không bằng nhau. Theo mặc định, khớp là 1 và không phù hợp là 0.

________ 33 (tự, khớp = 1, không khớp = 0) ¶(self, match=1, mismatch=0)

Khởi tạo lớp.

________ 34 (Tự, Chara, Charb) ¶(self, charA, charB)

Gọi một thể hiện hàm khớp đã được tạo.

Lớp ________ 30 ________ 36 (SCORE_DICT, SOMMETRIC = 1) ¶(score_dict, symmetric=1)

Cơ sở:

>>> from Bio.pairwise2 import format_alignment
>>> print(format_alignment(*alignments[0]))
ACCGT
| || 
A-CG-
  Score=3
2

Tạo một hàm khớp để sử dụng trong một căn chỉnh.

Attributes:
  • SCORE_DICT - Một từ điển trong đó các khóa là bộ đếm (dư lượng 1, dư lượng 2) và các giá trị là điểm số khớp giữa các dư lượng đó.

  • Symmetric - Một lá cờ cho biết liệu điểm số có đối xứng hay không.

________ 33 (self, scorce_dict, symmetric = 1) ¶(self, score_dict, symmetric=1)

Khởi tạo lớp.

________ 34 (Tự, Chara, Charb) ¶(self, charA, charB)

Gọi một thể hiện hàm khớp đã được tạo.

Lớp ________ 30 ________ 36 (SCORE_DICT, SOMMETRIC = 1) ¶(open, extend, penalize_extend_when_opening=0)

Cơ sở:

>>> from Bio.pairwise2 import format_alignment
>>> print(format_alignment(*alignments[0]))
ACCGT
| || 
A-CG-
  Score=3
2

Tạo một hàm khớp để sử dụng trong một căn chỉnh.

SCORE_DICT - Một từ điển trong đó các khóa là bộ đếm (dư lượng 1, dư lượng 2) và các giá trị là điểm số khớp giữa các dư lượng đó.(self, open, extend, penalize_extend_when_opening=0)

Khởi tạo lớp.

Symmetric - Một lá cờ cho biết liệu điểm số có đối xứng hay không.(self, index, length)

________ 33 (self, scorce_dict, symmetric = 1) ¶

Gọi một thể hiện kết hợp từ điển đã được tạo.(length, open, extend, penalize_extend_when_opening)

Lớp ________ 30 ________ 41 (mở, mở rộng, penize_extend_when_opening = 0) ¶

Tạo một hàm khoảng cách để sử dụng trong một căn chỉnh.(matrix)

________ 33 (tự, mở, mở rộng, penize_extend_when_opening = 0) ¶

________ 34 (tự, chỉ mục, chiều dài) ¶(align1, align2, score, begin, end, full_sequences=False)

Gọi một thể hiện chức năng khoảng cách đã được tạo.

________ 30 ________ 46 (chiều dài, mở, mở rộng, penize_extend_when_opening) ¶

Tính điểm số tiền phạt cho hàm GAP.

________ 30 ________ 48 (ma trận) ¶

In ra một ma trận cho mục đích gỡ lỗi.

________ 30 ________ 50 (Align1, Align2, SCORE, BẮT ĐẦU, END, FULL_STERENS = FALSE) ¶

Định dạng căn chỉnh một cách đẹp đẽ thành một chuỗi.