Navigationsweiche Anfang

Navigationsweiche Ende

Sprache wählen


Links

CitePlag – Zitatbasierte Plagiatserkennung

 

CitePlag ist das erste Plagiatserkennungssystem, das Citation-based Plagiarism Detection (CbPD) implementiert – ein neuartiger Ansatz, mit dem auch stark verschleierte Plagiate in wissenschaftlichen Texten erkannt werden können [6].

Bestehende Software zur Erkennung von Plagiaten untersucht Dokumente lediglich auf wörtlich übereinstimmende Textteile und erkennt daher in der Regel keine verschleierten Plagiatsformen, wie zum Beispiel Paraphrasen, Übersetzungen oder Ideenplagiate. CbPD behebt diesen Mangel, indem es zusätzlich die Platzierung von Quellenverweisen im Volltext von Dokumenten analysiert, um einen sprachunabhängigen semantischen „Fingerabdruck“ zu bilden und basierend darauf die Dokumentähnlichkeit zu berechnen [4].

CbPD kann auf jeden Text angewendet werden, der Zitate enthält – dies schließt wissenschaftliche Veröffentlichungen, Patente, Rechtsfälle usw. ein. Der Ansatz überwindet den Mangel bestehender textbasierter Plagiatserkennungsverfahren.

Unsere Untersuchungsergebnisse bestätigten, dass die Ähnlichkeit von Zitatmustern häufig auch dann erkennbar bleibt, wenn der Text übersetzt oder stark umgeschrieben wurde [3]. In vielen Fällen ermöglicht CbPD daher das Erkennen von Plagiaten, die mit den herkömmlichen textbasierten Ansätzen nicht automatisiert hätten identifiziert werden können: Zum Beispiel, wenn Text durch Ersetzungen mit Synonymen, Umstellungen der Satzreihenfolge oder durch Übersetzung verschleiert wurde. Dass Zitatmuster in plagiierten Texten häufig verdächtige Ähnlichkeiten mit den Zitatmustern in den Originalquelldokumenten aufweisen, wurde auch in unserer Analyse der plagiierten Doktorarbeit von Karl-Theodor zu Guttenberg [5] sowie einer Analyse des VroniPlag-Wikis bestätigt [2]. Eine Auswertung des zitatbasierten Ansatzes mittels einer umfangreichen Sammlung von über 200.000 wissenschaftlichen Veröffentlichungen enthalten im PubMed Central Open Access Subset zeigte die Praktikabilität des Ansatzes unter realen Analysebedingungen und für eine Reihe realistisch verschleierter Plagiatsformen [1].

Einzelheiten und eine eingehende Analyse des CbPD-Ansatzes finden Sie in der Dissertation von Bela Gipp, die als Buch im Verlag Springer Vieweg Research [2] erschienen ist und hier heruntergeladen werden kann.

Der Screenshot oben zeigt zwei Veröffentlichungen, die im CitePlag-Prototyp analysiert wurden. Übereinstimmende Zitate werden hervorgehoben und in einer zentralen Spalte für eine effiziente Sichtung der Dokumente verbunden. Die Dokumente haben keine wörtliche Textähnlichkeit: Die linke Veröffentlichung ist in Englisch und die rechte in Chinesisch verfasst. Man kann jedoch sehen, dass die Übereinstimmungen von Zitaten hoch ist und die Reihenfolge, in der die Quellen zitiert werden, in mehreren Absätzen nahezu identisch ist. Der englische Text enthält nur 7 Quellenverweise, die nicht mit dem chinesischen Text geteilt werden (graue Kreise).

Testen Sie CitePlag hier.

CitePlag ist als Open Source bei GitHub erhältlich.

ZUGEHÖRIGE VERÖFFENTLICHUNGEN

  1. Citation-based Plagiarism Detection: Practicability on a Large-scale Scientific Corpus,
    B. Gipp, N. Meuschke, and C. Breitinger,
    Journal of the American Society for Information Science and Technology (JASIST), vol. 65, iss. 2, pp. 1527-1540, 2014.
    (PDF | DOI | BibTeX)
  2. Citation-based Plagiarism Detection - Detecting Disguised and Cross-language Plagiarism using Citation Pattern Analysis,
    B. Gipp,
    Springer Vieweg Research, 2014.
    (PDF | DOI | BibTeX)
  3. Demonstration of Citation Pattern Analysis for Plagiarism Detection,
    B. Gipp, N. Meuschke, C. Breitinger, M. Lipinski, and A. Nuernberger,
    Proc. Int. ACM SIGIR Conf. on Research and Development in Information Retrieval, 2013.
    (PDF | DOI | BibTeX)
  4. Citation Pattern Matching Algorithms for Citation-based Plagiarism Detection: Greedy Citation Tiling, Citation Chunking and Longest Common Citation Sequence,
    B. Gipp and N. Meuschke,
    Proc. ACM Symposium on Document Engineering (DocEng), 2011.
    (PDF | DOI | BibTeX)
  5. Comparative Evaluation of Text- and Citation-based Plagiarism Detection Approaches using GuttenPlag,
    B. Gipp, N. Meuschke, and J. Beel,
    Proc. ACM/IEEE Joint Conf. on Digital Libraries (JCDL), 2011.
    (PDF | DOI | BibTeX)
  6. Citation Based Plagiarism Detection – A New Approach to Identify Plagiarized Work Language Independently,
    B. Gipp and J. Beel,
    Proc. ACM Conf. on Hypertext and Hypermedia (HT), 2010.
    (PDF | DOI | BibTeX)

MEDIENBERICHTERSTATTUNG

Die öffentlich-rechtlichen Radiosender Deutschlandfunk und Deutschlandradio Kultur haben über unsere Forschung zur Verhinderung und Erkennung von Plagiaten und über unser prototypisches...

mehr

Mehrere Medien berichteten kürzlich über unsere Forschung zur Verhinderung und Erkennung von Plagiaten und über unser prototypisches Plagiatserkennungssystem CitePlag.

Artikel sind erschienen in der...

mehr

Ein Artikel über unser Plagiatserkennungssystem CitePlag ist in der 59. Ausgabe von uni'kon erschienen.

Klicken Sie auf das Bild, um den Bericht in hoher Auflösung zu sehen.

mehr

CitePlag ist der erste Prototyp eines zitatbasierten Plagiatserkennungssystems (CbPD). Der Prototyp wurde kürzlich auf der SIGIR Konference 2013 vorgeführt.

Was macht CitePlag so neu?

Im Gegensatz...

mehr
zuletzt bearbeitet am: 08.12.2020